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内 容 提 要 


本 版 对 初版 的 许多 章节 进行 了 改写 与 扩充 ,增添 了 许多 重要 的 内 容 和 实 
际 应 用 例子 ,在 叙述 方法 和 内 容 编排 上 注意 重点 与 非 重点 .基本 内 容 与 进 一 
步 内 容 的 界限 ,层次 分 明 ,便于 教学 。 全 书 共 8 章 , 包 括 绪论 .估计 、 假 设 检 
验 .回归 分 析 与 线性 模 现 .试验 设计 与 方差 分 析 、 并 贯 分 析 初步 .统计 决策 与 
贝 叶 斯 统计 大 意 :抽样 调查 概述 等 ,内 纵 较 丰 富 `、 重 点 突出 、 文 字 确 切 易 懂 。 


本 书 可 作为 高 等 学 校 数学 专业 .统计 学 专业 及 有 关 专 业 数 理 统 计 课 程 的 教材 


FALLPU JJ JS LA "一 AAA 可 吃 一 LO 门 一 为 必 “一 世子 


或 参考 书 。 
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根据 我 们 在 北京 大 学 使 用 本 教材 (初版 ) 的 教学 实践 经 验 , 并 


汲取 了 国内 外 近 1 0 年 来 出 版 的 多 部 数理 统计 优秀 载 材 ( 见 参考 书 
目 ) 的 一 些 好 的 讲法 ,本 版 对 初版 的 许多 章节 进行 了 改写 与 护 


7 下 狼人 个 隐语 LV ALERT AU， 


以 便 在 内 容 上 和 编排 上 更 好 地 适应 高 等 学 校 相 关 专 业 数理 统计 ” 
谋 程 的 教学 需要 及 数理 统计 的 应 用 需要 。 


本 版 的 特 点 可 概述 如 下 。 

1 N_iRW、 天 了 六 各 生生 Ai 省 ， 

(一 ) 增添 了 许多 重要 内 容 。 例 如 

(1) 对 寻找 置信 区 间 和 置信 限 的 方法 进行 了 系统 论述 ; 
(2) 对 “假设 检验 ”中 的 刀 值 方法 进行 了 全 面 论 述 ; 


(3) 介绍 了 有 有关: 
方法 ; 


(4) 介绍 了 比率 的 检验 方法 ,特别 是 Fish 


\ 荆 7/ /1 ru 汪汪 A 法 9 -4 刀 ] 


(5) 对 逻辑 斯 请 回归 作 了 初步 介绍 ; 

(6) 对 考虑 交互 作用 的 正 交 设计 作 了 初步 介绍 ;等 等 。 

(二 ) 增加 了 许多 实际 应 用 例子 。 主 要 是 增加 了 日 常生 活 、 
会 调查 、 商 务 管理 .医学 试验 等 方面 的 例子 。 例 如 在 讲 比 率 的 两 
本 检验 时 ,介绍 了 某 公 安 局 两 个 刑侦 组 破案 能 力 的 比较 ;在 讲 
回归 时 介绍 了 生理 节律 模型 ;在 讲 正 交 设 计时 ,介绍 了 拖拉 机 

(三 ) 在 银 述 方法 和 内 容 编排 上 注意 重点 与 非 重 点 基本 内 容 


讲 一 步 内 容 的 界限 ,做 到 层次 分 明 , 便 于 教学 。 前 四 章 是 本 书 的 
ZL 一 光 和 个 有 外 发 ， 队 世 云 发 凡 姑且 折子 。 风 呈 年 下 小 小 量 


民 


态 总 体 的 Behrens - Fisher 问题 的 解决 


SS 到 
时 沙 莱 剖 


过 


C 


HT 


Y 


主体 部 分 。 茶 些 肉 容 ( 包 括 新 添加 的 一 些 内 容 ) 小 字 排 印 或 标题 上 
打上 * 号 ,以 示 这 些 内 容 不 是 最 基本 的 ,不 要 求学 生 擎 握 。“ 回归 
分 析 ”的 讲法 有 较 大 改变 , 先 对 一 元 线性 回归 作 系 统 论述 , 伏 后 再 


讲 线性 模型 和 多 元 回归 。 生计 下 有 时 六 者 不 到 蓄 线 生 空 间 的 铅 时 
理论 ,本 版 以 附注 的 形式 详细 介绍 了 不 
全 如 ,用 德 阵 的 基本 运 筑 直接 证 明了 


和 ] 


高 斯 - 马尔 可 夫 定理 。 


未 几 人 恨 忆 东 ar 全 HA 人 上山 抽 站 上 崇 才 二 岂 山 灾 疡 EL 址 
人 小 吹风 于 打动 了 居 刚 丁 了 办 和 过 了 不 人 :入 子 玛 人 例 阳 站 个 应 帮 缴 
学 大 网 规定 的 多 一 些 , 更 比 课堂 实际 讲授 的 多 一 些 。 这 样 做 有 逢 


了 学生 这 外 同 于 全 用 全 力 的 学生 达 学 更 多 的 未 西 ， 
编者 力图 与 时 俱 进 , 写 出 反映 时 代 猜 神 的 合适 教材 。 但 限于 


水 平 , 书 中 的 缺点 . 廖 误 一 定 不 少 ,欢迎 读者 和 专家 批评 指出 。 
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由 于 数理 统计 学 在 很 多 科学 研究 、 工 程 技术 和 经 济 管理 的 领 
域 里 有 广泛 应 用 ,许多 高 等 院 校 都 开设 数理 统计 课 。 本 书 是 根据 
笔者 在 北京 大 学 概率 统计 专业 的 教学 实践 经 验 , 在 先前 编写 的 同 
名 讲义 (北京 大 学 油印 本 ) 的 基础 上 进行 较 大 的 改写 与 扩充 而 成 


一 和 mw 一 mp -me -一 全 


的 。 在 编写 过 程 中 ,我 们 注意 了 下 列 各 点 : 
1) 力图 对 数 吾 统计 学 的 基础 部 分 进行 比较 ; 伍 确 


A AVIA 3 认 二 | PP RE AU PR AN LT 


面 届 
统 论 述 ,注意 介绍 统计 思想 和 统计 方法 ,特别 重视 数理 统计 学 


人 Rh 中 EUH 到 
羡 六 JRJ 小 oo 


2) 本 蔬 是 入 门 读物 ,只 要 求 读者 学 过 微 积 分 、 线 性 代数 和 初 
等 概率 论 。 为 了 氢 述 数理 统计 学 的 现代 发 展 , 有 少量 内 容 涉及 实 
变 函 数论 ,个 别 地 方 涉及 测度 论 。 这 些 涉及 较 深 数 学 的 内 容 不 是 
本 书 的 基本 部 分 ,不 要 求 读者 掌握 。 

3) 我 们 认为 ， 大 学 教材 的 内 容 应 比 教学 大 网 规定 的 多 一 上 
更 应 比 课堂 实际 讲授 的 多 一 些 。 这 样 做 有 利于 学 生 课 外 阅读 ， 使 
有 余力 的 学 生 选 学 更 多 的 东西 。 本 书 前 四 章 是 主体 部 分 ,要 求学 
生 掌 握 ; 后 四 章 是 介绍 数理 统计 学 的 一 些 重要 分 支 , 教 学 中 可 根据 


aa 


教学 时 数 选 学 部 分 内 容 , 只 要 求学 生 有 初步 了 解 。 我 们 把 前 四 章 


中 数学 推理 过 于 抽象 或 元 长 的 部 分 用 楼 体 字 排 示 更 求学 涉 
允 WA\ 了 J 4 丘 十 一 JJ 人 砚 殉 AU 了 八 RJ PR AAA RD 本 掉 印 ?1 芭 必 上 殉 工 


掌握 。 

本 书 初稿 完成 后 ,承蒙 中 山大 学 邓 永 录 教 授 、 邓 集 贤 教授 、 杨 

维权 教授 、 华 南 师 范 大 学 汤 沿 勇 教 授 、 华 东 师 范 大 学 虽 帮 刚 副教授 

进行 了 细心 的 审阅 ,他 们 提出 了 很 多 宝贵 的 意见 。 我 们 在 修改 和 

定稿 时 充分 考虑 了 这 些 意见 ,在 此 向 他 们 表示 衷心 感谢 。 高 等 教 

育 出 版 社 高 尚 华 同志 对 本 书 的 编号、 审查 与 出 版 始终 给 予 很 大 帮 
时 | @ 
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助 , 在 此 一 并 致谢 。 
由 于 我 们 水 平 有 限 ， 本 书 一 定 有 不 少 缺 所 和 错误 ,欢迎 各 地 专 


朗 和 尘 才 兹 下 
多 人 人民 月 招 此 。 


， 泽 李 示 风 
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4 月 于 北京 大 学 概率 统计 系 
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数理 统计 学 的 研究 对 象 


数理 统计 学 的 基本 概念 
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假设 检验 . 


1 日 丘 AL 上 吕 
问题 的 提 法 ， 


N - 卫 引 理 及 似 然 比 检验 法 . 
单 参 数 情形 的 假设 检验 


六 义 似 然 比 检验 be ee 
比率 的 假设 检验 ee 
拟 合 优 度 检 验 pe vv， 


一 元 线性 蔬 ) ) 妆 eeeseseseeesessesessespesesesgsesessgeeseeseeeeeeseeeseaeeeeeees 
线性 模型 的 参数 估计 .Ne 
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81 数理 统计 学 的 研究 对 象 


数理 统计 学 是 数学 的 一 个 重要 分 文 , 它 全 究 怎样 有 效 地 收 
集 .整理 和 分 析 带 有 随机 性 的 数据 ,以 对 所 考察 的 问题 作出 推断 或 
预测 , 直至 为 采取 一 定 的 决策 和 行动 提供 依据 和 建议 . 看 在 这 名 


5 
久子 开 六 人 许 审 月 随 仙 和 注 呈 了 生 儿 全 子 "用 征 壳 用 学 的 人 钱 究 和 围 . 


统计 学 也 了 就 是 数据 科学 . 由 于 实践 中 人 们 收集 到 的 数据 大 都 受到 


iv 友 上 AL 疡 上 后 2 nr DOI 一 KKP TH As 1 an 日 ]- 、T aa 了 HH LO re 立 / 


随机 性 的 影 啊 ,因而 数理 统计 学 是 统计 学 的 主要 组 成 部 分 . 在 许 
多 西方 国家 (如 美国 ) ,这 两 个 名 词 的 含义 基本 相同 ,许多 大 学 里 统 


ai 


计 系 就 是 研究 数理 统计 学 的 ,使 用 “数理 统计 学 ”一 词 时 只 是 强调 
统计 学 中 用 到 很 多 现代 数学 .在 我 国 由 于 历史 的 原因 ,这 两 个 多 


ar We 


词 在 实际 使 用 时 有 较 大 差别 . 笔者 相信 ,在 若干 年 后 ,这 两 个 名 词 

所 指 的 范围 将 相差 不 大 . 
数理 统计 学 在 工农 业 生产 .工程 技 术 、 自 然 科 学 .经济 学 、 社 会 
让 嫩 不 于 


举 等 领域 都 有 很 广泛 的 应 用 ,大 量 实际 问题 属于 数理 统计 学 衣 
-六 -可 《TARHR 及 1 一 JJ ARE -大 1 人 JJ JJ EL 一 六 


究 范 围 . 举 几 个 例子 ， 


1A\ nm 大 TH- 下 口 的 寿命 ? 二 1 电 人 二 ETHHE 也 人 
\L 上 /全 16 寺 大生 人 过 征 二 直 R 砚 星 上 如 十 忆 昌 女 有 日 J 
J 了 


评价 某 批 电子 设备 的 使 用 寿 命 ,随机 抽取 了 1 18 台 做 试验 ， 测 得 才 
命 数据 如 下 (单位 :h):,17,29,50,68,100,130,140,270,280 ,340， 
410,450,520,620,190,210,800,1100. 

问 : 整 批 电子 设备 中 ,寿命 超过 200h 的 占 多 大 比例 ? 


(从 第 二 章 知 ,这 个 比例 大 约 是 e= 强 一 0.533. ) 


有 些 寿 命 问题 更 为 复杂 ,如 导弹 的 贮存 寿命 如 何 确 定 ? 设 茶 
部 门生 产 同一 型 号 的 一 批 导弹 ,制造 后 进行 贮存 ,以 备 将 来 之 用 


已 蝴 呈 在 基肥: 厂 能 证 水 大 恋 成 论 口 怎样 合理 地 确定 贮存 期 ? 
可 乒 和 人 -何人 信人 有 了 肥 名作 庆 ，? 冯 后 / 妈 DH， 二 有 和 注 志 十 和 人 条 7 
这 是 很 重要 的 实际 问题 . 若 随机 抽取 ” 件 进行 使 用 试验 ， 设 第 ; 


《hr Ar 一 1 0D lb 上 上 上 归 -PP 上 2 En6 山下 he 
1 二 大- 2 一 人 9 LCL9 , 72 ) ,试验 绪 有 果 无 非 是 : 以 可 人 日 JJ- 有 人 


效 或 无 效 . 在 前 者 情况 下 ,第 :个 导弹 的 贮存 寿命 大 于 访 , 在 后 者 
情况 下 第 : 个 导弹 的 贮存 寿命 小 于 富 , 在 两 种 情况 下 ,精确 的 贮存 
寿命 是 不 知道 的 有 了 上 述 类 型 的 数据 ,如 何 确定 该 型 号 导弹 的 


本 ee 玫 宇 有 有 AL SS 一 和 为 六 JJ 详 9 六 于 FA ar AAA 一 了 


贮 : 仔 期 ? 
(2) 某 针 织 厂 进行 技术 单 新 . 在 针织 品 的 漂 日 工 和 世 过 程 中 ， 
要 考虑 温度 对 针织 品 断 裂 强力 (主要 质量 指标 ) 的 影响 , 为 了 比较 


o 呈 上 QAn 册 忆 昌 nm -二 3 口中 在 这 两 个 温 FET 下 LDL 了 R 类、 
170 -OO 人 的 影 中 | 有 AU 力 J" 1L。J/ 迪 站 | ai 过 1 /大 J 1 


验 , 测 得 数据 如 下 : 

70 人 时 的 强力 ; 20.5，18.8，19.8，20.9，21.5，19.5， 
21.0,21. 2; 

80 人 时 的 强力 ;17.7，20.3，20.0，18.8，19.0，20. 1， 
20. 2 ,19. 1. 

究竟 两 种 温度 下 的 强力 有 没有 差别 ? 可 以 算出 这 个 试验 中 
70 CC 下 的 平均 强力 是 20.4,80 下 的 平均 强力 是 19.4, 这 1 个 单 


位 的 差别 主要 是 由 于 温度 不 同 造成 的 还 是 由 于 随机 误差 造成 的 


FF 泪 度 下 拘 东 所 小 动 出 大 名 鉴别 泪 且 佬 和 
(注意 ,在 同 { 血 / 及 下 的 数据 波动 也 不 小 )? 这 力 jJ 人 人 直人 


从 第 三 章 知 道 , 这 1 个 单位 的 差别 主要 是 由 于 温度 不 同 造成 


的 ,70 人 时 的 强力 确实 大 些 . 
(3) 基 公 安 局 有 两 个 刑侦 组 ,在 过 去 一 年 内 御 一 组 接手 25 件 


中 人 一 和 


人 命案 ,结果 侦破 了 23 件 ; 第 二 组 接手 了 35 件 人 命案 ,结果 侦破 


了 30 件 , 问 ， ; 两 个 组 的 侦破 能 力 有 无 差别 ? 


~ < 上 LA 和 和 及 CA AU 六。 


从 第 三 章 知 道 , 没 有 理由 认为 两 个 组 的 侦破 能 力 有 差别 . 
(4) 在 使 用 海洋 重力 仪 探 测 海 底 石 油 时 ,仪器 上 显示 出 的 信 
号 Zi) 万 是 重力 加 速度 信号 (ti 与 海浪 干扰 信号 2 的 玲 加 : 
。2 。 


ZLt) 一 SCt) 十 77) (0 委 上 L 委 了 ) 


干扰 信号 ”( 妨 的 强度 一 般 是 有 用 信号 sb 的 十 万 倍 ， 问 :如 
何 从 强 干 扰 背 景 中 把 微 旷 信号 (提取 出 来 ? 也 就 是 如 何 设 计 一 


JJLNAm | JU 门 -可 J 了 LA YL 岂 AL Ts Li ww 。 EL 
个 滤波 器 使 得 输入 是 Zi (0 和 甩 弘 于 si)(0O< <T)? 
这 个 问题 已 习 DA HL 70 年 代 被 3 京 大 学 和 北京 5 地 质 仪 葬 三 
1 ALL JJ vv LU Tv 人 NE LN 一 站 HU J 订 > 地 让 . { 义 石 
的 同志 合作 解决 了 . 2 


(5) 在 低 销 定 膨胀 合金 材料 研究 中 ,如 何 确定 Ni\Co Cu、Fe 
的 合适 比例 以 保证 合金 材料 的 膨胀 系数 与 陶瓷 材料 的 膨胀 系数 很 
接近 ? 如 何 做 到 尽量 节省 Co 的 用 量 ? 

这 个 问题 可 用 数理 统计 中 的 回归 分 析 法 处 理 ,已 于 20 世纪 


70 年 代 秆 北京 大 学 和 治 金 部 等 单位 的 同志 合作 解决 了 ,参看 第 
四 音 


(6) 为 了 探讨 吸烟 与 患 慢性 文 气 管 炎 是 否 有 关联 ,调查 了 339 


地 虱 yOnT 圭 
/NIRTVLZXH | 人 友 : 





ae 


问 :从 这 批 数 据 能 否 断 定 患 慢 性 支气管 炎 与 吸烟 有 关 ? 
利用 列 联 表 分 析 法 知 符 案 是 肯定 的 .参看 第 三 


1 JJ JAY 全 AT 人 门人 一 门 - 下 


从 上 面 几 个 例子 看 出 ， 数理 统计 能 够 处 理 的 问题 是 多 种 多 样 


上 和 国 计 丰 有 亚 f 有 大 4 是 和 0 册 和 尖 和 二 下 在 和 葵 理 和 什 AI 妆 六 
吕 J。 PPAUD 月 又 [电工 妥 / 有 JJ TPR LA 及 大和 上 一 LTDJ JAD 


了 研究 随机 现象 (偶然 现象 ) 中 的 规律 性 ,就 需要 收集 数据 ,并 在 此 
基础 上 对 数据 进行 分 析 ( 由 表 及 里 .由 此 及 彼 ), 以 得 出 科学 的 结 
论 ,这 正 是 数理 统计 学 的 任务 . 当然 ,和 整个 数学 一 样 ,数理 统计 
学 只 是 各 个 学 科 各 个 业务 领域 的 研究 工具 ,解决 实际 问题 时 不 能 
离开 所 论 问题 的 专门 知识 

。 3 。 


个 数学 大 厦 的 其 他 部 分 有 密切 关系 . 数理 统计 学 中 用 到 很 多 近代 
数学 知识 ,主要 是 微 积分 、 函 数论. 线性 代数 ,也 用 到 沁 上 分 析 、 扰 


不 芝 组合 数 些 搜 旬 代 数 和 微 分 几何 的 知识 , 们 后 数理 统计 尝 奖 
了 了 子 \ 表 日 多 下 丈 1ATH 和 万] 的 DA 人 外 Lr 入 


系 最 密切 的 是 概率 论 ， 在 很 大 程度 上 可 以 说 :概率 论 是 数理 统计 


Ap 和 -0 TH Lana 四 JE 这 、 但 它们 县 两 个 并 列 
第 的 基础 ,数理 统计 学 是 概率 论 的 一 种 应 用 . | 蕊 已 用 十 三 


的 数学 分 文学 科 ,没有 从 属 关 系 . 


数理 统计 学 又 是 一 门 实 践 性 很 强 的 应 用 科学 , 它 同 大 量 的 数 
据 打交道 ,处理 数据 是 一 件 十 分 重要 而 又 相当 繁琐 的 工作 ,电子 


AAA 一 L 一 人 


计算 机 是 数理 统计 学 的 重要 工具 , 每 位 优秀 的 数理 统计 工作 者 应 
该 不 仅 具 有 良好 的 数学 基础 ,而 且 能 够 熟练 地 使 用 电子 计算 机 . 


S&9D 芳 3 阳 夭 计 上 几 失 其 木 和 人 候 
32 勾 考 项 讶 子 风 全 个 地 
洲 人 TH LA 1 由 六 辐 . 卡 : -人 -JRT 人 售 、 蝗 mA -> 4 人 3 
效 奸 统 填 字 的 最 荃 本 袖 人 瓶 是 :总 体 、 术 本 、 统 十 量 、 信 填 、 假 玉 
检验 、 统 计 决 策 等 


我 们 常 把 被 研究 的 对 象 的 全 体 ( 包 括 有 形 的 和 潜在 的 ) 称 作 总 
体 . 常用 随机 变量 (随机 向 量 、 随 机 过 程 )X 来 表示 一 个 总 体 ( 或 总 


站 有/ 枯 -一 二 生疏 1 ACER EL 有 人- 


体 的 特性 值 ), 例 如 用 X 表示 一 批 电子 设 备 的 寿命 ,意思 是 :从 中 
任意 抽取 一 件 电 子 设 备 , 其 寿命 是 不 能 预先 确定 的 ,可 看 成 随机 变 
量 X 的 值 . 本 讲义 是 数理 统计 学 的 人 门 教材 ,主要 讨论 随机 变量 


由 寻 外 才 开奖 王 站 人 估 且 PR 三 是 区 有 大 了 的 情 扩展 丰 4 和 林 钴 
HR IIRLZ， 二 JJ 人 必 中 二 [中 T 志 ELIER II 有] 有 有 AU 


计 分 析 " 和 “时 间 序 列 分 析 ” 等 课程 专门 进行 论述 . 


以 下 .以 随机 变量 为 例 介 绍 重 干 基 本 概念 (对 于 随机 回 量 、 
过 程 的 情形 可 做 相仿 的 讨论 ). 当 总 体 用 随机 变量 X 描述 时 


后 


的 分 布 图 数 下 (z) 也 称 为 总 体 的 分 布 函数 .: 要 了 解 总 体 就 是 
解 其 分 布 函数 . 在 数理 统计 学 中 ,分 布 函数 F(z) 是 未 知 的 ,和 


mA FL ve 3 呈 人 An 


工作 就 是 要 对 总 体 进行 调查 (或 观测 ) 并 对 调查 来 的 数据 进行 科学 
处 理 , 以 便 知 道 下 Cz) 是 什么 样 的 . 
- 十 梓 进 行 十 查 ? 逻辑 上 有 两 种 方式 :普查 和 抽查 ， 彰 查 就 是 
e。 4 。 


下 枉 


) 
啦 呈 洋 昔 


对 总 体 的 每 个 个 体 都 进行 调查 ,这 种 方式 有 很 大 的 局 限 性 , 当 总 体 
包含 的 个 体 数 相当 大 时 ,由 于 调查 工作 量 太 大 而 难以 采用 ; 当 总 体 


包含 的 个 体 有 无 限 多 或 对 个 体 的 调查 目 右 和 破坏 性 昌 根本 不 能 采 
蕊 有 有 和 有 人 区 2 关公 三 


用 . 另外 一 种 方式 就 是 抽查 , 即 从 总 体 中 抽取 看 干 个 有 代表 性 的 


个 (末了 rr 昌 人 允 有 昕 h 人 次 抽取 时 得 到 的 个 体 的 观测 
-Fi 人 1 ,从 zy AAA 人 这 里 从; 人 才 7 z LN AP 可 寺 JH- 人 明 JU 人] 


值 ),(X:，…Xo) 叫 做 总 体 的 样本 叫做 样本 量 或 样本 大 小 ， 怎 
样 抽查 呢 ? 数理 统计 学 中 来 取 ” 随机 抽样 法 ， 即 梓 本 中 包含 哪些 
个 体 不 是 事先 确定 的 ,总 体 中 的 每 一 个 体 均 有 机 会 进入 样本 . 在 
数理 统计 学 中 使 用 得 最 多 的 是 简单 随机 抽样 法 … .这 个 名 词 有 两 
种 不 同 的 含义 叫 , 其 中 最 常用 的 一 种 含义 是 : 它 是 这 样 的 一 种 抽取 


三 | 人 一 


方法 ,使 得 Xi ，…X， 作为 2 个 随机 变量 是 相互 独立 的 ,而 且 与 总 
体 有 相同 的 概率 分 布 . 这 种 样本 叫做 “简单 随机 样本 ? 


叫 


| 


插 样 才能 得 到 简单 随机 样本 “ 呢 ? 有 两 种 基本 方法 . 由 “有 
放 回 地 逐次 随机 抽取 法 ” 总 体 中 的 每 个 个 体 都 有 同样 的 机 会 被 


TAc LU JJ FT AVITI 号 “人 人 


抽 和 样本 , 且 每 次 抽出 的 个 体 , 在 记 下 其 值 后 ,还 要 放 回 到 总 体 中 
去 ,以 保证 在 下 次 抽取 时 每 个 个 体 仍 有 与 第 一 次 抽取 时 相等 的 机 
会 被 抽 人 样本 ， 随 机 性 表现 在 :样本 中 包含 哪些 个 体 , 是 出 目 机 
会 ,而 不 是 在 抽样 前 预定 的 . @ 对 总 体 X 进行 多 次 独立 的 重复 观 
测 ,这 时 观测 到 的 值 可 以 看 成 是 总 体 的 所 有 可 能 信 ( 无 形 地 存在 


着 ) 的 一 部 分 . 例如 用 仪器 对 茶 一 物体 的 长 度 进 行 精密 测量 ,我 们 
把 测量 结果 看 成 随机 变量 (总 体 可 想像 为 一 切 可 能 值 的 集合 ,例如 


it < 人 


是 凤 生 ”一 的 结果 记 


(0,co) 或 更 大 的 集合 ) ,把 盖 次 重复 测量 的 结果 记 为 X ，…, 信 ,， 
则 得 到 简单 随机 样本 . 


我 们 强调 指出 ,在 实施 抽样 之 后 得 到 7 个 实数 人 19 ”9 过 nn。 它 


@ 在 总 体 只 含有 限 个 个 体 的 情形 (如 有 N 个 个 体 ),“ 简 单 随机 抽样 法 "往往 指 : 
从 总 体 中 随机 地 抽取 ”个 . 这 里 “随机 地 ”含义 是 :从 N 个 个 体 中 任意 抽取 个 ,共有 
C8% 个 可 能 的 绪 果 ,这 些 结果 有 相等 的 概率 ,都 是 (C%J-:. 这 是 无 放 回 的 抽取 法 ,得 到 
的 样本 (Xi ，…,X,) 不 是 下 文 定义 的 “简单 储 机 样本 ”, 我 们 称 之 为 “单纯 随机 样本 ,以 


示 区 别 . 对 这 种 样本 ,在 第 八 章 中 进行 讨论 . 
全 0 全 


们 分 别 是 Xi ，…，,X， 的 观测 值 , 通 常 把 z，…，,z, 叫做 样本 值 , 也 


简称 为 样本 . 为 了 使 用 方便 ,同一 字母 有 时 代表 随机 变量 ,有 时 代 


记 拘 寺 证 贤 Ho 0 佑 只 要 看 清 F 下 人 六 月 不 全 吕 | 和 得 刊 的 诅 加 


4 
学 者 加 以 注意 . 
一 V 一 HE Th DR In 在 上 上 JJ -9 TI FE AOE 工 上 Ai 上 上 了 一 一 让 上 上 大 
本 讲义 主要 研究 入 -二 -了 咀 澳 几 桩 本 也 百 简 称 随 机 样本 或 梓 本 ， 


数理 统计 学 就 是 采取 随机 抽样 法 效 取 样本 . 并 从 样本 推断 总 


体 的 性 质 . 统计 推断 的 类 别 很 多 , 主要 有 两 类 ,一 类 是 估计 , 另 一 
类 是 假设 检验 . 下 面 是 这 两 类 问题 的 一 些 提 法 . 


WA An 二 


估计. 设 总 体 X 的 分 布 函数 F(z) 是 未 知 的 ,如 何 根据 样本 值 
Zi Zn 给 出 下 (Cz) (一切 二) 的 估计 值 ? 
设 入 的 分 布 昂 数 为 了 (zyO0) ,0 一 《0， 9 ,0 ) 是 未 知 回 量 ,如 何 


-本 人 个 人 二 LI 0 
“LI IDILU， 


一 般 地 , 设 gCF) 是 分 布 函数 FCz) 的 泛 函 ,如 何 根据 样本 值 


本 二 
六 JPT 


1 


] 


) Te 
了 


呈 
中 氏 


> 


1 EC 
与 了 是 两 个 相互 独立 的 随机 变量 ,如何 根 据 (X,Y) 的 样 


本 值 ( ”V1 ) ， … )，【〔 工 ， ,yy ) 估 计 概 率 己 ( 和 二 了 )? 
基 入 ,和 ,是 一 个 随机 序列 , 始 何 根据 买 ,…,X 的 观测 值 


“下 Ac EL AAA -7 办 于 7 ”人 关 加 7 2 


Zily7zz，m…Zn 预测 X+vw(Cm 是 正 整数 ?的 值 ? 
佑 计 问 题 是 多 种 多 样 的 . 我 们 把 预测 问题 看 成 特殊 的 估计 问 
题 . 全 计 问 题 的 特 氮 是 找 出 合适 的 们 计量 0(X，…,X,) ,作为 被 


人 -上 目 wA、 庆 个 [二 、 
TRY 下 5JJL II 以 电 ， 


假设 检验 . 设 总 体 X 的 分 布 函数 下 (z) 是 未 知 的 , 秃 是 一 些 


ACT 一 了 上 问 一 一 一 一 2 ID m 一 人 二 -人 


-万 < 一 3 上 上， 人 A 绽 站 《DODD 
4 多 妈 X 寺内 太 日 示 人 胆 ， 问 : CCZz) 和 是 合 属 于 弘 ? 或 者 问 看 法 AP | 以 


GZz)E 和 (2. 1) 
是 否 可 以 接受 ? 更 根 措 又 的 栏 本 值 > 。 给 予 明 确 的 回答 


DR Ti 门 < Ji 个 LEEL .人 1] ?> 9 ML/ 了 避 是 -了 


换 句 话说 ,在 R" 中 要 确定 一 个 集合 友 CR" , 当 (zl，…zo)E 砚 时 
拒绝 看 法 (2. 1); 否 则 ,接受 看 法 (2.1), 这 个 克 叫做 否定 域 . 怎样 
选择 合适 的 ? 

。 6 。 


设 X 与 并 是 两 个 随机 变量 ,它们 的 分 布 函数 分 别 是 F(z) 与 
C( 工 ). 问 :如 何 根据 (xX， Y) 的 样本 值 (zi ,y) 判 新 从 与 


-让 让 4 志 4RANLI 又 问 : 如 何 判 是 征 否 戌 这 工 Z)= 王 C(CZz) (一 切 并 放 《 


限 设 检验 问题 的 提 法 也 是 多 种 多 样 的 ， 抽样 验收 .科学 试 


验 质量 管理 .民意 测验 等 很 多 领域 中 要 用 到 ， 
通常 称 样本 Xi, ,…,X 的 函数 gc(X ，…,X ) 为 统计 量 , 这 里 


g 是 完全 已 知 的 函数 下， 一 用 本 Xi，…,X， 的 值 取 征 ,统计 量 的 
量 


。 


值 计 有 由 所 下 了 在 估 ] = BF 国人 作证 县 癌 8 有 目 和 交 、[L 
旺 区 圩 H 山 修 JJ， 在 估计 | 可 题 里, 信 计 量 束 征 统 冯 


验 问 题 里 ,否定 域 也 常 由 统计 量 表 达 出 来 . 把 样本 看 成 多 
时 ,统计 量 也 是 随机 变量 , 它 的 分 布 有 时 叫做 抽样 分 布 . 

估计 问题 ,假设 检验 问题 可 看 成 是 更 一 般 的 统计 决策 问题 的 
特殊 情形 . 在 第 七 章 中 对 统计 决策 问题 有 简单 介绍 ， 


$3 数理 统计 学 发 展 简 史 


党 


数理 统计 学 的 发 展 大 致 可 分 三 个 时 期 来 叙述 . 
20 世纪 以 前 ,这 是 数理 统计 学 的 萌芽 时 期 . 在 这 兆 长 的 时 期 


l 
里 ,描述 性 统计 占据 主导 地 人 位， 描述 性 统计 就 是 收集 大 量 的 数 握 


JIHH 和 -LUL 7 一 炎 天 一 一 “ 志 JJ 有 大 [LIL 7YT yu 人 -LA AN 呈 凡人/ 站 


并 进行 一 些 简单 的 运算 (如 求 和 , 求 平均 值 , 求 百分比 等 等 ) 或 用 图 
表 .表格 把 它们 表示 出 来 . 中 国 古 代 就 有 钱粮 户口 的 统计 ,西方 国 
家 也 多 次 进行 人 口 统计 ,早期 这 些 统计 工作 都 与 国家 实施 统治 有 
关 . 统计 学 的 英文 词 statistics 源 出 于 拉丁 文 , 系 由 status( 状 态 、 
国家 ) 和 statista( 政 治 家 ) 衍 化 而 来 . 这 时 期 也 出 现 了 一 些 现在 仍 


委 -。 Emma 一 一 Le 妆 


很 常用 的 统计 方法 ,如 直方 图 法 . 人 超出 描述 性 统计 范 


围 的 成 就 是 高 斯 和 勤 计 德 关于 最 小 一 匹 小 工作 . 在 统计 思想 上 
国有 了 2 下 网 中 人 网 也 全 六 小 -一 不 汉 仁 蕊 7 


G@ 为 了 进行 严密 的 数学 研究 ,通常 假定 g 是 Borel 可 测 函数 . 学 过 实 变 函 数论 
的 读者 知道 ,Borel 可 测 函 数 是 极为 广泛 的 一 类 函数 ,我 们 在 实践 中 遇 到 的 函数 一 般 都 
是 Borel 可 测 函数 . 


的 重大 进展 是 ,数据 是 来 自 服从 一 定 概率 分 布 的 总 体 , 而 统计 学 就 
是 用 数据 去 推断 这 个 分 布 的 未 知 方面 . 这 个 观点 强调 了 推断 的 地 
位 ,使 统计 学 摆脱 了 单纯 描述 的 性 质 ， 由 于 高 斯 等 人 在 误差 方面 


的 全 究 工作 , 正 态 分 布 ( 又 伺 高 斯 分 布 ) 的 性 质 和 重要 性 受到 三 沁 


重视 .19 世纪 末 皮 尔 逊 (区 ， Pearson，1857 一 1936) 引 进 了 一 个 以 
他 的 和 名字 命名 的 分 布 族 , 它 包含 了 正 态 分 布 及 现在 已 知 的 一 些 重 


人 Ti ea 人 


要 的 非 正 态 分 布 , 扩 大 了 人 们 的 眼界 . .皮尔 了 还 还 提出 了 一 个 估计 


方法 一 短 仁 计 泪 用 来 估计 他 所 引进 的 分 布 族 中 的 参数 
/人 人 ADPL 人 ER 有 不 IO/ 了 和 挝 有 刀 放 大于 有 2 比 双 ， 


为 外 ,德国 的 大 地 测量 学 者 赫 尔 梅 特 (K. Helmert71876 年 在 


研究 正 态 总 体 的 样本 方差 时 ,发现 了 十 分 重要 的 X 分 布 . 高 尔 顿 
(下 ，Galton) 在 生物 学 研究 中 提出 了 回 妇 分 析 方 法 . 这 些 都 是 数 
理 统计 学 发 展 史 中 的 重要 事件 . 

20 世纪 初 到 第 二 次 世界 大 战 结 束 ,这 是 数理 统计 学 莲 勃 发 展 
达到 成 熟 的 时 期 . 许多 重要 的 基本 观点 和 方法 ,以 及 数理 统计 学 


的 主要 分 文学 科 , 都 是 在 这 个 时 期 建立 和 发 展 起 来 的 ， 在 其 发 展 
中 ,以 费 乔 尔 (R，A，Fisher 1890 一 1962) 关 代表 的 黄 国 党 派 扯 


9 YA LA LIUJ AS Ne 二 上 W 二 LA NS PN 本 VR N 一 


了 主导 的 作用 

K. 皮尔 逊 在 1900 年 提出 了 检验 拟 合 优 度 的 X 统计 量 ,并 证 
明 其 极限 分 布 (在 原 介 设 成 立时 ?是 X 分 布 . 这 个 结果 是 大 样本 统 
的 先 


驱 性 工作 ， 20 世纪 20 年 代 费 希 尔 又 作 了 重要 发 展 


一 一 包 ”NA TU LA 记 - 比 一 LS。 


寺 


紧 接着 的 一 项 重要 进展 ， 是 皮尔 逊 的 学 生 , 英 国医 生 苞 歼 特 


1 及 页 厂 Cn (1 、、、 Ar py ap 9 To Ah 蕊 一 jp 、 _ 导 . 上 yz 二 7 人 /AN 
《WwW ， 95， osset, 所 名 字 生 )1209 守 证 出 上 统计 量 的 精确 分 


布 一 一 上 分 布 , 开 了 小 样本 理论 的 先河 . 


比 皮尔 逊 略 晚 的 费 希 尔 对 现代 数理 统计 的 形成 和 发 展 作出 了 
最 大 的 贡献 ,他 是 一 些 重要 统计 分 支 和 方法 的 开创 者 . 最 重要 的 


人 一 一 一 LT AAA 一 


成 就 有 :系统 地 发 展 了 正 态 总 体 下 种 种 统计 量 的 抽样 分 布 理 论 ,这 

标志 着 相关 、 回 归 分 析 和 多 元 分 析 等 分 支 的 建立 ;建立 了 以 最 大 他 

然 估计 为 中 心 的 点 估计 理论 ;创立 了 实验 设计 ,并 发 展 了 相应 的 数 
ee。 8 


据 分 析 方法 一 一 方差 分 析 
在 数理 统计 学 的 另 一 个 主要 分 支 一 一 假设 检验 的 发 展 中 , 费 


pe HH 丰 计 重要 作 困 .人们 个 刘 夫 了 难 理 论 的 受 综 化 和 深信 五 容 骨 [ 
让 外 了 胡 十 这 二 妇 TFI 芝 了 坟 己 证 二 和 有 人 尔 蕊 HI 不 /人 八 二]， 人 大 有 


归功 于 条 曼 (JJ Neynman，1894 一 1981) 和 小 皮尔 逊 (E，S. 


D-~” >。 一 1RQE_ 1TQRnN 仙人 门 讽 10D0QR_ 1QaR 任 H 基 8 心志 了 
Pearson， Ov JJ JJvOv7 局 1J4 二 上 vc 7uOoOo -人 j 蕙 19 及 人 了 了 系列 


文章 ,建立 了 假设 检验 的 严格 数学 理论 . 奈 曼 对 数理 统计 作出 的 


太一 项 很 重要 的 贡献 ,是 在 1934 一 1937 年 间 建 立 了 置信 区 间 的 数 
学 理论 . 它 基于 概率 的 频率 解释 ,并 与 奈 曼 -皮尔 逊 的 假设 检验 理 


本 Te 


论 有 密切 大 系 ， > 
多 元 统计 分 析 是 数理 统计 学 中 有 重要 应 用 价值 的 分 支 之 一 . 
1928 年 以 前 , 费 希 尔 在 多 元 正 态 总 体 的 统计 分 析 中 作 过 基础 性 的 


二 作 1o2Q& 任 加 小 性 (TT WU WIIT; shart) 导出 了 著名 的 “ 威 YI 4E /AN 
-LTFE，JL7cO -和 有 觅 人 7] 坷 \  ，WW，WISnatt7 可 司 有 和 bb 了 册 人 2 讨 万 


布 | 玫 后 ,这 和 各 人 人 快 . 我 国 著名 学 者 许 宝 又 


70) 对 这 一 领域 以 及 线性 模型 的 统计 推断 理论 ,作出 了 
70) 对 这 一 领域 以 及 线性 社 型 的 统计 推断 理论 ,TFI J 


娄 基 性 的 工作 ， 时 间 序 列 分 析 是 数理 统计 学 中 有 重要 应 用 价值 的 


人 


叉 一 分 支 . 尤 尔 (G. U. Yule) 在 1925 一 1930 年 间 引 进 了 自 回 归 
和 序列 相关 等 重要 概念 ,商定 了 这 个 分 支 现 代 发 展 的 基础 维 纳 


人 1 Ap 下 


(N，Wiener) 在 第 二 次 世界 大 战 期 间 为 研究 大 炮 射 击 问 题 而 提出 
的 时 间 序 列 分 析 方 法 (外 推 . 内 插 和 光滑 化 ) ,不 但 对 炮兵 而 且 对 整 
个 工程 界 都 有 重要 意义 .瓦尔 德 (A，Wald，1902 一 1950) 在 第 二 


加 革 rr 四 大 各 期 可 担 中 了 序 骨 和 概 谈 比 检 验 涉 (人 页 人 FEFP 友 二 本 
1 已 IT 八 RARJIJJUEDHI JJ 门 大 了 二 上 人 人 人 ?人 六 全 关 放 有 宇 女 


意义 (例如 贵重 产品 的 抽样 检查 与 验收 ), 也 为 战 后 序 贯 分 析 的 发 


在 之 -全 全 和 了 一 


展商 定 了 基础 . 
， 友 上 所 述 ;在 这 不 到 半 个 世纪 的 时 期 里 ,数理 统计 学 得 到 了 丰 


ph 9 er Et” 


富 的 多 方面 的 发 展 ， 鸣 立 了 这 门 学 科 在 人 奖 文 化 史上 的 地 位 到 
于 黑 R( 天 Cramer) 在 1946 年 写 的 和 名著“ 统计 学 的 数学 方法 ”对 这 


JJ 一 EL WA 全 @ 是 访 加 吕 人 克 二 


一 时 期 的 主要 成 就 作 了 扼要 的 总 结 , 是 此 后 20 年 间 数理 统计 学 的 
主要 教科 书 . 
战 后 时 期 :在 这 一 时 期 中 ,数理 统计 学 在 应 用 和 理论 两 方面 继 
。 9 。 


公 


续 获 得 很 大 发 展 . 在 应 用 上 ,由 于 经 济 和 和 插 事 技术 的 快速 发 展 坎 


及 电子 计算 机 的 出 现 , 使 数理 统计 学 的 应 用 达到 了 前 所 未 有 的 规 


模 ， 有 些 需要 大 量 计 算 的 统计 方法 ,在 战 前 限于 条 件 而 无 法 使 用 
王 耳 妆 八 星 了 中 和 拭 H 甩 和 人 人? 伺 HR 的 取 本 人 宋 和 AM 人 必用 ， 


这 个 障碍 今日 已 不 复 存 在 统计 方法 已 渗透 进 各 种 专门 的 学 科 领 


+ 2 FE 下] 让 名 有 4 人 me 工 | Z > FE 有 层 . APac TH 片 物 综 计 上 人 2 六] 十 
城 ,形成 - 许多 边缘 学 科 , 如 统计 /从 里 上 月 性 人、 工 志 区、 NAN 开 57 、 


地 质 统 计 、. 计 量 经 济 学 .医学 统计 等 . 
战 后 的 统计 理论 沿 着 纵深 方向 快速 发 展 . 例如 最 大 似 然 估 计 
和 非 参 数 统 计 的 大 样本 理论 ,在 战 前 只 有 初步 的 结果 , 现 已 达到 完 


et Po 滞 3 Wm FA 本 一 Pu 本 no 


善 的 地 步 . 瓦尔 德 在 1950 年 创立 了 统计 决策 理论 , 它 从 人 与 大 目 
然 进 行 博弈 的 观点 出 发 ,企图 把 形形色色 的 统计 问题 纳入 一 个 统 
一 的 本 式 之 下 ,这 种 理论 对 战 后 数理 统计 许多 分 支 的 改 展 产生 了 


吕 -大 呈 2 吧 | 特别 是 参数 估计 这 个 分 支 
区 八 有 到 ?可 妃 J 下 了 多 上 和 季 1 六， 


随 着 概率 论 的 高 速 发 展 ， 随机 过 程 的 统计 逐步 形成 了 内 容 让 


妇 站 重 本 人 二 革 出 站 处 机 清 小 瑾 兴 上 担子 已 区 纯 410 仁 
疼 日 y 里 女 刀 久 ， 共 二 于 葡 降伏 友和 夺 比 户 坊 ] 显著 地 位 ， 它 是 40 年 


代 维 纳 - 柯 尔 莫 戈 罗 夫 滤波 理论 和 60 年 代 卡 尔 曼 滤波 理论 向 非 线 
性 领域 的 扩展 . 前 苏联 学 者 李 普 泽 尔 (R. S，Liptser) 和 和 硕 拉 也 夫 
(A，N. Shiryayev) 在 1974 年 写 的 专著 “随机 过 程 的 统计 ”系统 论 
述 了 这 方面 的 理论 . 

在 战 后 数理 统计 的 发 展 中 ,一 个 引 人 注 目的 现象 是 页 叶 斯 学 
派 的 崛起 . 这 个 学 派 的 思想 可 溯源 于 1763 年 发 表 的 著名 论文 论 


丰 沁 丰 > 里 站 | 有 RU 上 Oh29 人 人 的 仿 滋 有 目 扣 周 收 本 站 0 其 下 Rows 
月 大 人 过 加 太 日 冰 扒 ,所 和 信 昌 9TF 有 下 大 国 议 g 和信 站 罗 上 .了 ay4c5， 


1702 一 1761). 这 篇 文章 基于 归纳 推理 的 思想 ., 当时 未 引起 多 大 反 


产 m 二 关于 | 十 庆 败 Ar 《iT -fr 


啊 , 却 在 180 年 后 重新 引起 人 们 的 注意 .20 世纪 50 年 代 以 来 ,这 
尝 派 的 兴起 不 是 没有 原因 的 ,传统 的 统计 学 发 展 趋 于 成 熟 并 得 


ar nn aa an 于 


到 大 量 应 用 后 。 其 固有 的 弱点 开始 显露 并 逐渐 为 人 们 所 认识 . 传 
统统 计 方 法 不 能 充分 利用 过 去 经 验 积累 起 来 的 知识 ,在 小 样本 问 


AR 0 人 


题 里 表现 出 难以 克服 的 局 限 性 . 这 一 点 在 可 靠 性 统计 问题 中 特别 

突出 而 在 页 叶 斯 学 派 那里 , 却 有 独到 的 方法 ,利用 过 去 积累 的 经 

验 , 在 应 用 中 常 得 到 意 想 不 到 的 效益 ,虽然 如 此 ,实行 贝 叶 斯 方法 
。 10 。 


仍 存 在 很 多 困难 ,对 验 分 布 的 客观 性 常 引起 非议 , 贝 叶 斯 学 派 的 观 
反 还 难以 为 乒 大 统计 工作 者 普 志 接受 , 贝 叶 斯 学 派 和 传统 学 派 的 


鱼 兴 佣 痢 长 期 在 在 就 日 前 履 站 而 吝 户 宪 基体 FF 仍 处 于 支配 
汪 人 从 说 讶 全 ”有 上坟 再 ?日 月 仆人 二 人 人 从 呈 


二 2 
地 位 . 
FRR -一 六 人 TH LO > wA 0 Er TV 引 - 上 HE 上 cr 了 人、 AAS 二 时 “vv 大 本 
明太 / 口 如 和 大 E= 儿 了 归 太 JJ 火 一 显 者 特 点 是 电 于 /] 


算 机 的 广 沁 使 
用 . 这 不 仅 使 得 过 去 难以 计算 的 问题 能 够 解决 ,而 且 促 使 能 有 效 


地 利用 现代 计算 机 强大 计算 能 力 的 统计 学 新 理论 问世 . 自助 法 
(bootstrap) 和 投影 寻 踪 法 (projection pursuit) 就 是 统计 学 工作 者 


呈 j 


颇 感 兴趣 的 两 种 方法 . 1980 年 以 来 ,对 它们 的 应 用 范围 和 理论 基 
础 ,统计 学 家 做 了 许多 人 研究 工作 . 
以 上 对 数理 统计 学 的 历史 作 了 简短 的 叙述 . 读者 如 想 知 道 更 


和 的 记 中 馈 刘 诸 人参 委 陈 基 卫 区 的 YU 尖 香 统计 此 人 税 中 人 湖南 教训 出 
2 有 JJ// 广 人 HB 有 2 珍 人 骨 控 布 打 有 上 且 八 芭 LE 岂 了 -六 加 驻 /人 八 计 六 3 月 EDI 


和 版 社 ,2002)， 


。 1 。 
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$ 1 参数 估计 的 方法 


佑 计 问 题 是 多 种 多 样 的 ,很 难 纳入 一 个 统一 的 模式 . 本 章 讨 
论 的 估计 问题 的 类 型 是 比较 简单 的 ,首先 讨论 总 体 参 数 的 估计 ，, 然 
后 讨论 分 布 函 数 .密度 函 数 的 估计 : 

设 随 机 变量 和 -的 分 布 呵 数 是 下 (z,0) ,密度 函数 或 概率 郑 
是 F(Cz,0)( 当 X 是 连续 随机 变量 时 , f(z,0) 是 通常 的 概率 分 布 密 
度 ; 当 X 是 离散 随机 变量 时 , fF(z,0) 是 概率 函数 , 即 X 取 值 等 于 xz 
的 概 变 ) ,其 中 0 一 (0 ,0 ,… ,0 ) 是 未 知 的 参数 ( 同 量 ),0 的 一 切 可 


-AU T 7 7 WA AAAL TWO 7 7 了 全 YT 了 -人 


能 的 值 的 集合 记 为 8 ,这 个 @ 是 m2 维 欧 氏 空间 民 ” 的 已 知 非 空 


储 请 rr 有 且 0 鬼 证 值 昭 针 ( 通 和 府 且 证 续 明 和 沥 》 站 .bn 全 相近 Y 
厅 ， 以 上 7 征 8 大 四 四 铸 、 晤 币 和 下 和 过关 国难 4， AVI < 


的 简单 随机 样本 zi,zz，…z, 估计 gs(2) 的 值 ? 
例如 , 设 X 一 NI )( 正 态 分 布 )，ps dr 是 未 知 参 数 ,0 三 
(po JEG@=( 一 coyco)X(0,ce). 如 何 估计 P(X>>c)? 这 是 上 述 





< 形 | AH 和 全 > 太一 二 Drwv、、 1 (Cl 一 NA 了 田 (，、 旦 大 -yy 全 
和 二 日 JAD 大 [让 LN 人 -一 7 二 二 记 人 人 SL\ 过 /让 淮 1 比 
I 
正信 分 布 蝎 效 , 印 
六 工 .2 
古 ( 工 ) | 一 -ezdv 
_ 元 
仁 计 rrON 的 关 名 县 刘 人 任 仁 计 D 0 0 共 它 人 们 的 古 订 值 
ID 上 AVI7IRJA 人 和 和 二 HT ID VI9V2， ?Vi 9 人 性 用 JR ID LE 


别 是 0 ,0 .0 , 则 5g(O， ,0 ， 0 ) 就 可 作为 gf(O) 的 估计 值 . 
如 何 获 得 6=(0 ,0 ，…，,0。) 的 估计 呢 ? 方法 很 多 ,最 重要 最 
常用 的 有 两 种 ,一 是 最 大 似 然 ( 估 计 ) 法 , 另 一 是 和 抢 ( 估 计 ) 法 ,分 别 
e。 17 。 


介绍 如 下 . 
(一 ) 最 大 似 然 法 


这 是 者 名 类 国 统 订 -了 ”全 Eve 人 人。 


人 


X 的 密度 顺 数 (或 概率 函数 ) 是 三 


W 三 
人 29? 9 mn 7 JI 日记 友 因 人 -大 人 人 加 多 7] 征 


AN 

S 
二 
下 
攻 
民 
洁 
硬 
站 
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LOzyz3i0) 一 [于 7FGzi0) (1. 1) 


1 一 】] 


妆 ( 藉 ) 9 ” ,X,) 取 年 值 (zi 9 ””” ,时 ,大 (zi 9 "97 ;0) 是 0. 的 
函数 ,这 个 函数 叫做 样本 的 似 然 函 数 . 若 6 一 p(zi,… zy) 满足 
CCZI 六 一 sup LLCzi TO) 


则 称 是 0 的 最 天 似 然 们 计 ， 也 和 0 的 各 分 量 是 4 的 相应 分 量 的 


人 了 
了 八 As ID 了 了 |。 


以 下 记 工 (O 王 LCz ,zx;0) 由 于 ln 工 是 z 的 严格 增 函 


-AT 7 广 、\ 


数 , 故 工 (0) 的 最 大 值 点 6 也 是 ljn 工 (0) 的 最 大 值 点 .怎样 求 得 最 大 
似 然 估 计 2 呢 ? 当 @ 是 开 集 而 且 ln 工 (0O) 的 偏 导 数 ( 导 数 ) 存 在 时 ， 


Ai 别 7 汪 


从 微 积 分 知识 知 ,最 大 似 然 估计 2 应 满足 方程 组 ， 


ln (0O) 3ln TO 


5“ 一 0 一 0 (1. 2 ) 
.2) 称 为 似 然 方程 组 . 从 这 个 方程 组 求 出 根 后 ,再 判断 根 是 不 是 


| 必 R 一 水 人 央 广 同上 寺 ~ HE ae AM T 7 mAN - 纪 -六 -Ai E 六 fr DAE 2 
让 然 本 数 的 最 大 值 反 . 女人 仁和 已 :局 LU/ 人 小 件 许 辣 可 办 有 ， 妇 上 且 


接 研 究 工 L(6) ,寻找 最 大 值 点 . 


1 


志 > 


此 fa 地 目 、 人 Te Ai | 


最 大 似 然 估计 的 根据 是 什么 ?采用 最 大 似 然 估 计 合理 吗 ? 我 
位 来 考虑 一 个 简单 的 情况 . ,假定 一 个 盒子 里 有 自 球 - 黑 球 共 3 个 


本 mm 人 fi 仿 


但 不 知 白 球 . 黑 球 备 有 见 个 .如 果 有 放 回 地 从 盒子 里 抽 3 个 球 ,发 
现 第 1 第 3 个 是 黑 的 ,第 2 个 是 白 的 . 问 :如何 估计 盒 中 黑 球 所 占 


@ 在 不 引起 六 淆 时 可 简 记 为 二 | . 
1 
凶 为 了 便于 数学 上 处 理 ,我 们 要 求 0 一 p(zl Zn) 是 zi，…zn 的 Borel 可 测 上 果 
数 , 这 个 要 求 在 实际 工作 中 一 般 都 是 满足 的 . 
e。 了 。 


的 比例 6? 不 难看 出 ,9 的 可 能 值 的 集合 @ 一 | ,于 ,本 ,1 从 使 中 
有 放 回 地 取 球 ,第 ;次 取出 的 结果 记 为 


( 工 ， 取出 的 是 黑 球 
0， 取出 的 是 昌 球 


则 (Xi:,X:,Xs) 的 联合 概率 函数 为 
三 (ziyzayZa30) 一 后 (一 0 2 3 
《这 里 z; 一 0 或 1,z 一 1,2) 3)， 
当 (Xi,X:,Xs) 取 定 结果 为 “第 1 .第 3 个 是 黑 球 ,第 2 个 是 日 
球 ”, 即 zi 一 zs 一 1,zz 一 0 时 ， 


L(b) 一 久 (1 一 0) 
LO) 是 盒 中 黑 球 所 占 比例 为 0 时 ,事件 “第 1 .第 3 次 取出 的 是 黑 
球 , 第 2 次 取出 的 是 白 球 "的 概率 对 应 8 的 各 种 可 能 值 , 这 个 梳 
率 如 下 ， 
人 
3 3 
LO) | 0 和 0 
27 27 


既然 “第 1 .第 3 次 取出 的 是 黑 球 ,第 2 次 取出 的 是 白 球 ” 是 已 
经 确实 发 生 了 的 事件 , 故 与 这 一 事实 最 匹配 的 9 值 应 该 是 使 其 出 


现 概率 取 最 大 值 的 9 一 子 了 这 就 是 9 的 最 大 似 然 估计 . 


到 本 咕 时 0 YA 


引 
本 


FF 述 解 释 完 全 适用 于 任何 离散 型 随机 变量 情形 ,我 们 ] 也 于 
上 上 还 解释 完全 运用 于 任何 离 融 型 随机 灾 量 情形 , 找 们 也 日 


广 到 有 通 稼 密度 杖 数 的 情形 . 设 观察 到 样本 值 .XI 一 Zi，… 
Z, ,实际 上 表明 观察 到 事件 A 一 (XIE(Czl 一 GZ 十 8)，…， 
(zu 一 06,z 十 8S) 发生 (对 一 切 正 数 8)， 兄 知 


re 
je 


"和 


双 


， 入 
入 


和 


和 (CCzi 9 ”” ”9》 尼 m ;O) (LO) ， 


( 当 $ 很 小 时 7) 可见 , 若 用 最 大 似 然 估 计 :0 代替 和 时 (A) 达 到 
最 大 . 
以 上 是 从 直 轴 上 理解 最 大 代 然 估计 的 全 


< 


衣 
纯 
忌 
并 ， 
水 
让 
和 
人 
妹 
上 
站 
纪 
药 
呈 


意 s0 有 
lim PC 一 中 < 一 1 (1. 3) 
这 里 |0, 一 中 表示 4 与 .0 的 距离 ( 欧 氏 距离 )、 比 (1. 3) 更 强 的 性 
质 是 
P(lim 0=0) 一 1 (1. 4) 
-证 1 ay 了 队 立 衣 党 称 ] 在 相合 性 :从 (1 4 了 附 立 衣 尖 和 钦 站 右 
右 (《L.5) 友 也 过 帅 窜 月 入 全 性 石和) 网 过 吊 和 从 Z， 及 
强 相合 性 ， 这 方面 的 一 般 理 论 需 要 用 到 较 多 的 数学 知识 (如 测 
度 论 ) 
下 面 通过 一 些 例子 说 明 最 大 似 然 估 计 的 求法 与 相合 性 . 


< T < 


(1) 两 点 分 布 〈 也 称 伯 努 利 (Bernoulli) 分 布 ) 
设 随机 变量 X 取 值 0 或 1, 且 
力 一 已 (X 王 1) 一 1 一 PCX 一 0) 


于 是 X 的 概率 函数 是 
< 一 岂 恩人 人 [一 
P(X 一 z) 一 因 (1 一 思 )1rz，(z 一 0，1) 
甘 上 HA 未 种 AAACIO1T 讽 梯 木 且 > > 。 > 几 I 们 4 包 要 和 沽 且 . 
2 忆 丰 全 ?有 二 Lv 以 件 什 古寺 192 9 9 1 大 TAI 四 KE 


e。 了 0 。 


是 铺 的 最 大 似 然 信 计 ， 直 观 上 ,如 果 某 随机 事件 发 生 的 概率 是 ， 
则 在 ”次 独立 重复 试验 中 ,此 事件 发 生 的 频率 为 二 >) zi 一 户 ,正好 
是 最 大 似 然 估计 . 由 强大 数 律 知 广 有 强 相合 性 


MOD\、 二 oo 光 r AN -有 - 
\C/ 日 刀 X -JR 


密度 末 数 是 . 
一 人 六 
LA AN 一 14e ” Z 一 0 
JjZ AI) 一 | 
0 ， rr<c 0 
A 2 


其 中 信和 《0 co)， 样本 9 2 9 *。 9 人 )， 的 似 然 盖 数 为 





JTJ 一 ,TT 一 Sr 

LN\A/ 人 了 人 人 4 
上 晤 
J 让 
din 志 C47 7 二 证 

ET 1 
qd 人， 乞 
故 似 然 方 程 的 根 ia/ > zy ， 不 难看 出 i 是 4 的 最 大 似 然 估计 
Le an -1 PDT A = 日 BA 
仁和 冰心 | 中 日 J2 -天草 到 /人 局 痢 大 仇 伴 谎 ^ 征 ] 日 拍品 
例 1.1 已 知 某 种 电子 设备 的 使 用 寿命 从 开始 使 用 到 失效 

为 止 ) 服 从 指数 分 布 ,密度 函数 FCz,) 一 Me=(z>0 必 盖 0)， 今 随 


机 抽取 18 台 , 测 得 寿命 数据 如 下 (单位 :h): 
17,29,50,68,100,130,140,190,210 
270,280,340,410,450,520,620,800,1 100 


问 :如 何 估 计 4? 和 
采用 最 大 似 然 法 . 利用 公式 站 一 一 ,现在 二 一 18， >- 





2 





密度 函数 是 





9 ,人 一 -CA 
太 Z [ ) /了 
其 中 一 中 C(0， Co ) ,MG 一 co， ah ”9 对 应 的 似 


4 饮 吗 葵 站 
然 曙 数 为 


其 如 
| 本 ( 一 2 
21 、 瑟 7 


Te 


ER 
了 (Zi Znim0) 一 人 








nr 1 1n(2A) -- 王 ] 1 00 
和 了 一 一 InC2r7 7 mn 2 《人民 ， 风 ) 
似 然 方程 组 为 
aln 民 1<x 
一 计 24(z 
9lnL 


甘 相 县 TS RAT NVvV 一 HT 验证 们 包 妆 儿 
AS 人 网 1 < 必 97 LA 下 必 ; 咏 ] 。 J CA ML IOATTS 3 双人 
】 1 
了 了 pz Far-A ~ AN EE LI Ab FI >、 》 分 另 AP ET AN AN AL-、1 
也 确实 在 2,6) 处 达 最 大 值 , 所 以 ,分别 是 wp,G 的 最 大 似 然 估 讨 ， 
由 于 总 体 的 期 望 EX 一 方差 Var(X) 一 已 X2: 一 (EX)2 一人， 
从 强大 数 律 知 PClimO 挛 一 总 一 1 而 


故 PClim6 盖 9) 一 1 这 就 证 明了 请 ,6 分 别 是 pw,8 的 强 相 合 估计 
(4) 韦 布尔 (Weibull) 分布 
密度 函数 是 


AT 1 IE 1 下 
OO 征 .1n By JI 过 


也 从 一 全 心 


人 


并 人 0 


工 站? 
) 9 


7 





人 7》 e 一 人 


样本 叱 1 9 人 2 9 


有 


似 然 方程 组 为 


普 ] . 龙 ; 


玫 
i 
] 


荆 


和 ~ 


+yinzr 一 
] 





如 
人 了 
到 


一 ?ln 7 十 


《1. 5 ) 
- 《1.7) 


(1.6) 








ee。 18 。 


再 代入 (1. 5) 得 


是 似 然 方程 组 的 解 ,而 且 似 然 函 数 工 在 ( 癌 , 让 达 最 大 值 ! 请 读者 
自己 验证 这 一 点 ). 与 指数 分 布 . 正 态 分 布 的 情形 不 同 , 这 里 的 次 


没有 明显 白 和 小 2 专 状 也 本 摸 它 证 直角 招 越 方 程 (1] & 由 于 
明显 的 仇 字 表达 陈 , 要 找 它 陨 需 解 超越 方 在 (1.8). .由 了 


(1. 8) 式 左 端 是 疡 的 严格 减 函 数 , 利 用 计算 机 可 以 迅速 地 得 到 次 


7 
三 


数学 上 可 以 证 明 ,六 少 分 别 是 my7 的 强 相 合 估计 . 
(5) 均匀 分 布 
密度 函数 是 


we 











(Zi iavb) 一 人 ) 上 | (并 ,7) ， 





好 
(一 ] ， 当 ac 委 min 7; 且 
人 1<in 
ITL(z yay0) 一 < Phnax 并 
-一 Ta8 共 之， 
1 过: 委 


0， 其 他 
故 a,6 的 最 大 似 然 估 计 分 别 是 ac 三 Inin 六 ,0 一 max 工 ， 


去 1 站 1 和 雪 ; 生 六 





TIiai -一 JR 4 玉 3 
由 于 
Pa <Z) 一 1 一 [1 一 下 (z) |， 
P(a 一 al 二 6e) 王 P(a 十 se 乏 0 委 0) 
一 |1 一 上 (Ga 十 e) 
(1 ee 
5 一 吉 ) 1 
故 2/P(|a 一 “| 过 e) < co, 于 是 P(lima= 一 oa) 一 1, 即 2 是 a 的 
六 一 】 
强 相 合 估计 . 
(二 ) 和 矩 ; 
这 是 著名 英国 统计 学 家 人 Pearson 在 1894 年 提出 来 的 ， 设 


随机 变量 X 的 密度 函数 (或 概率 函数 ) 是 FCz,0) ,其 中 0 一 (0 

0 ?是 未 印 参数 知 X 的 & 阶 原点 抢 三 下 X* 存在 , 则 人 也 是 

0 ，…0。 的 函数 , 记 为 geC0 0)(CE 一 1,2,…)， 假定 从 方程 组 
(0 0 一 TV 


pv(O 9?””“” ,0 ) 一 人 


” @ 注意 ,这 里 6 依赖 于 样本 量 ”应 记 为 名 , 对 任何 正 整 数 氏 和 入 , 令 ， 
A& = 存在 m>N 使 得 1 各 一 51>> 雯 | 





} ,PCAk) 雪 己 P 
1 风 一 用 


( , 令 No 姑 PhAr 半 0(K1)， 于 是 PCA) 一 0， 从 而 P( 头 | 记 一 中 六 
0) 一 0. 这 就 证 明了 
PKlimb 一 5) 一 1 


e。 OO0 。 


可 解 出 : 


纪 一 方 (Y 9 “”” ，V ， ) / 
(VW 9 ，YV ，) 


人 


0 一 万 (Vi wyVn) 
设 zz 是 X 的 样本 ,用 样本 生 


-1 
人 一 一 》 Ti (1. 9 ) 
1 ;=1 
如 人 LV rrPD 一 1 05 xz) ,然后 用 
杀人 但 放 YA 一 上 770) 敌后 用 


1 一 六 (Vi ， 7 ) 
来 估计 中 Q 二 1.2， sa 这 种 估计 未 知 参数 的 方法 叫做 抢 法 
(这 里 考虑 的 是 原点 矩 , 某 些 w 也 可 用 相应 的 中 心 矩 px 一 无 (和 一 


IAANR 《共和 提 和 3 个 十 让 万 T 《 人 T 了 Y\ 
LA 7/ 代 蔡 ,然后 进行 奖 似 的 处 理 , 仍 称 息 法 )，. 


和 矩 法 的 根据 是 什么 呢 ? 很 简单 ,是 强大 数 律 . 实际 上 ,根据 强 


-人 了 7 7 1。 7 _ \_ 1 
大 化 和 健 知 上 (um ve 三 4 ) 一 |. 当 所 有 广 是 连续 熙 数 时 , 必 
如 





Pirmnao 一 0 一 1 
“上 辣 二 NILLLLLLU LUR 7/ 工 
略 
例 12 设 X~~NOooy, zz 是 样本 值 , 试 求 ，o2 的 抵 
可 三 人 2 工 全 “AR5C 7 9 慰 1》 >\ 尖 7 人 -1 TEL AN、 LRCG 六 /一 
估计 
司 AnT7 一 及 Mr 一 ， T7 一 及 一 -2 人 2 工 月 . 
wvAnh ”1 人 LA、 9? YY 2 2 HR ， 4 作 
0 (1.10) 
2 2 
Le 一 V， 一 1] 
FRR 人 上 N rn 人 | N1_ 2 /XIAL3YLTT xnTr 人 和 人 71 AN 
站 YI 一 /vi 证 Y2 一 /ii 凡 册 1P 江 YITHY2y， NAN\L Tv/ 
1 1 
-AI[ 十 
舍 
] 旬 
7 一 一 》, 7; 一 工 
六 7 i 





并 2) 一 ( 却 > 


对 于 正 态 分 布 的 参数 pe 来 说 , 矩 佑 计 和 最 大 似 然 佑 计 是 一 
样 的 ,但 对 于 其 他 很 多 分 布 , 它 们 并 不 一 样 . 
。21 。 


例 1.3 设 式 的 概率 密度 函数 是 


] 
”9 0 和 并 过 0 
Ce 9) 一 | 四 
八 十 六 /由 
避 ， 其 他 
这 里 0 是 未 知 的 正 数 . 设 m ，…,z, 是 X 的 样本 ,不 难看 出 ,b 的 最 
大 似 然 估计 56= max rz;。 另 一 方面 ,EX 一 上 故 0 的 矩 估计 5 一 
1 委 ; 委 岗 


7 
例 1.4 人 台风 可 以 引起 内 陆 降雨 . 下 列 36 个 数 是 24 小 时 降 
雨量 的 实际 观测 数据 (单位 :mm) ， 
31.00 2.82 3.98 4.02 9%.50 4.50 11.40 
10.71 6.31 4.95 5.64 5.51 13.40 9.72 
6.47 10.16 4.21. 11.60 4.75 6.85 6.25 
3.42 11.80 0.80 3.69 3.10 22.22 7.43 
5.00 4.58 4.46 8.00 3.73 3.50 6.20 
0. 
赁 经 验 知 道 这 种 降雨 量 数据 一 般 服 从 下 分布, 分 布 密度 为 
0 ， Z 妇 0 
ziayD) 一 1 





V: 一 EX 一 o8(C8 十 ] ) 

并 ] 36 

凡 一 入 一 二 Ti 一 7.29 
36 所 


ap 一 7/. 29 
lo 808 十 1) 一 85. 59 
得 z 一 4. 45,8 一 1. 64. 
以 上 介绍 了 最 大 似 然 估 计 法 和 和 抢 估 计 法 ,还 有 许多 其 他 的 佑 
计 法 . 由 于 估计 问题 多 种 多 样 , 需 要 人 们 针对 各 个 具体 问题 的 实 
际 情况 制定 恰当 的 估计 方法 ,以 满足 实际 工作 的 需要 ,读者 从 下 面 


人 是 到 


的 实际 例子 不 难 理解 这 一 点 . 
例 1.5 估计 方法 曾 成 功 地 用 于 情报 工作 . 在 第 二 次 世界 大 


1 AAA NA 了 AAA 1 人 一人 一 一 


战 期 间 , 盟 军 曾 用 一 种 “序列 号 ”的 统计 方法 估计 德国 的 武器 生产 ， 
结果 非常 有 效 ， 事情 是 这 样 的 :德国 的 每 件 装备 (无 论 是 V 一 2 火 
箭 、 坦 克 还 是 汽车 轮胎 等 ) 上 都 刻 有 一 个 数字 (序列 号 ) ,表明 它 按 
该 类 装备 制造 出 来 的 次 序 排 在 第 几 . 例如 ,到 某 天 为 止 制造 出 的 


马克 一 [ 坦 死 共有 六 辆 ,每 辆 坦 殉 市 有 一 个 号 码 ( 从 1 至 和 这 六 


从. 训 光 上 的 人 售 \、 NT 人 估 且 肯定 不 大 4 首 上 人 HE 和 人 一、 了 
| 琵 女 全 上 > 1 7/。4y 及 和 起 咀 十 太 M 人 仆人 AHN 朋 上。 在 战争 进行 过 程 


中 , 某 些 号 码 ( 序 列 叶 ) 被 盟 军 知道 了 (由 于 某 些 德军 坦克 害 俘 获 或 


2 一 Ce 国 本 二 二 


者 德 皇 的 邮件 被 截获 ), 例 如 已 过 已 生 … 扩 忆 是 盟 军 获知 的 
7 (7 之 2) 个 序列 号 , 问 :如 何 估 计 坦 到 的 总 数 N? 


ii 


我 们 可 把 这 个 N 看 成 某 个 随机 向 量 的 概率 分 布 中 的 参数 
从 1,2,…,N-1,N 这 N 个 数 中 随机 地 抽取 ， 个 ,共有 {” ) 种 结 
果 ， 我 们 假定 各 种 结果 出 现 的 机 会 均等 ,出现 ( 司 , 记 ，…-, 坟 ) 的 神 
率 为 (人 ) ，N 究竟 比 &(zn 个 序列 号 中 的 最 大 者 ) 大 多 少 呢 ? 和 


然 想到 应 该 利用 玉 二 名和 <…<A 中 相 邻 两 个 数 的 间隔 来 估计 . 一 
种 办 法 是 用 





d 一 
太一 如 十- 一 2(4 一 Ar 一 1) (参看 [10]) 
1 一 2 
来 估计 N. 不 难看 出 
Wi; 一 十 -上 (下 ) 一 1 (1. 11) 
1] 一 


可 以 证 明 , 用 丈 : 估计 六 是 没有 系统 偏差 的 . 也 就 是 说 ,虽然 户 ， 


刀 ，…,u 的 值 有 随机 性 ,但 是 鸡 ; 的 数学 期 望 恰好 是 N 


注 “ 我 们 可 以 证 明 


上 W :一 一 
实际 上 ， 对 任何 i(1 去 i 和 过 N 一 nz 十 1 有 


-1 
PCA =-D=(” 1NA 
1 一 /Nm 1/ 


对 任何 ;2 委 ; 委 N) 有 
Pd -D=-( 1)(，) 
和 


于 是 厌 , = >》iP(R, 一 1 





Ai IN 
CLAN \7 
-ai)( 
AN 1/ 
这 里 用 到 了 恒等式 
(2)=( 
Po AAA 人 1 十 7/ 
十 ] 
(这 个 恒等式 利用 关系 式 (” ) 十 ( ，，)=( ”1 ) 容 易 证 明 ) 
wa 
一 Si 人 (人 (人 
一 \m 一 1 人 nm/ 
人 一 1 1 1 Ar 、 一 1 
CN 一 DR 1)( 
人 一 ) 7 人 一 : 1 
CN+DZ (1) 半 crD( | 
人 一 ] 人 一 1 
-LN+DZ(。 -2()|(，) 
_| NTDINNT_ INTINYIINNY -+ 
| 、 Na Am 十 1/ IN\n/ 7 十 ] 


ee。 04 。 





《1. 12 ) 


二 二 
和 


《1]. 14) 


〈1. 15) 


”由 此 可 见 


= 全 站 (7 一 1)(2 十 1) 


-入 了 
-一 人 YY 


根据 这 个 估计 方法 ,如 果 有 5 辆 坦克 被 俘获 ,所 带 的 序列 号 是 
14,28,92,146,298, 则 六 的 估计 值 是 


4 
II 一 “9 人 一 509 
次 世界 大 战 结束 后 , 盟 军 查阅 了 德国 的 官方 记录 ,发 现 上 


[之 万 | 中- 一 泪 和 丝 到 的 作证 这 人 全 田 甘 人 信息 下 洒 人 人 FE 作 十 夺 孜 
= JJ Ja 后 工 JHJ IRON ITN IC) 言 县 来 源 作 出 的 售 计 精确 


得 多 . 例如 采用 上 述 序列 号 方法 估计 出 德国 1942 年 生产 坦克 3 400 


< 是 ar 一 一 是 电工 DDI P 一 T 二 十 <- NT 1 


,很 接近 实际 情况 ,而 盟 盏 利用 间 读 活动 及 其 他 情报 推测 出 的 数 
字 是 18 000 辆 ,与 实际 情况 大 相 径 庭 . 出 现 这 种 情况 的 原因 是 许多 


情报 受 纳粹 德国 的 夸大 宣传 的 影响 ,序列 号 方法 则 比较 客观 . 
郑 忠 国 (1938 一 ) 告 诉 作 者 ,估计 量 丸 ; ( 见 (1.11)) 还 可 以 


改进 ,他 指出 估计 量 


by 





风 ， R 十 二 (R 一 有 | 一]1) (R。 0 ) 
1 ;=1 

册 A1 类 (r oa 甘 里 让 月 上 H 月 和 AT 日 TUr 上 天 是、 
虽 有 -天 庆 玫 也 和 十 上 WwW bb 万 过 了 取 四 

不 难看 出 

7 十 1 
网 ,一 R 一] (二 . 16 ) 
72 
注 从 (1.15) 和 (1. 16) 知 


Ce 生平 


注意 所 ,记者 是 随机 变量 ,它们 的 概率 分 布 与 N 有 关 . N 不 同 概 
率 分 布 也 就 变 了 . 因而 (1.12) 和 (1. 17) 中 的 数学 期 望 符号 与 N 有 关 ,严格 说 
应 用 Ex 代替 于 . (1. 122 和 (1. 17) 的 准确 含义 是 :对 一 切 N 盖 ”等 号 成 立 . 

我 们 可 用 初等 方法 直接 证 明 下 列 重要 结论 : 设 W，…, 妨 ) 是 和 的 任何 
估计 ,只 要 满足 ENvy( ，…A) 一 NO 对 一 切 N 它 由) ,就 一 定 成 立 


。 25 。 


PNCOCR RD 一 入) 之 ENCW2 一 N) (1. 18) 
而 且 当 WA ，…A,) 持 允 : 时 (1.18) 中 左 端 大 于 右 病 . 
证 明 稍 长 . 不 妨 设 (1. 18) 中 左 端 有 限 . 今 


(1D) 一 ENCOCA 有) | 大 一 中 
一 > ， (PC 一 站 一 一) 


1 一 …<< 旨 一 ( 国 


/一 ] 
了 yi 


ti] <…< 让 一 / 
则 EN(CV 一 N): 一 EN(CV 一 四 (ED) 十 四 CR) 一 人) 
一 尼 N(V 一 凡 (R))2 十 已 NGCOCR 一 人 ): 


[Co 
[] 
之 
[ 
1 
性 
AN 
人 
袜 
wx 
Se 
AN 
站 
AN 
和 
| 
Sa 
< 
AS 
AN 
| 亚 忆 
攻 
S7 
YA 


我 们 指出 
EN 。U( 肛 ) 二 已 VCW( 有 ))2 


~ 六 加 N 
实际 上 ,Envy，VCD) 一 > P( 一 站 ENv(WW()| 名 一 六 一 >P( 一 
| 【一 闻 【一刀 


六 


VCODEN(Cb 久 一 一 >》0CODPC 一 站 WO) 一 N(CVCA D)) 


{ 一刀 


另 一 方面 ,ENy (A) 一 >,P( 一 040) 
{ 一刀 


N 
一 > 也 CR， 一 /) 卫 NGCWCR: 9。。 天， ) AR 一 1) 


{ 一 妃 





(有 ) 一 册 : (1. 20) 
实际 上 ,因为 EN (VD) 一 多 ,) 一 N 一 N=0( 对 一 切 N 四 ， 即 
人 
> 50 一 (22 一 1)|PGu = 站 =0 (1. 21) 
人 一 L7 \、 1 


由 于 P(&A, 王 />0( 一 切 /=22 十 1 N). 今 入 = 十 1 从 (1.21) 知 


%(D) 一 一 一 1(01 一 mn 十 1,…，N). 故 (1. 20) 成 立 . 
利用 (1. 19) 和 (1. 20) 知 


ee 00 。 


EN 一 入 ) 一 开 EN 一 仇 : 十 有 AN (太一 太 ) 
故人 1. 18) 成 立 , 且 4 和 太 : 时 EN(CV 一 从) 全 开 N( 了 一 从 ) . 
换 句 话说 , 克 : 是 所 有 “无 偏 估计 ”( 见 下 一 节 的 定义 3. 1) 中 方差 最 小 的 . 


F- 沁 诬 列 旺 方法 的 合理 性 (有 (1 12 17)) 的 证 明 中 了 种 1 人 人 但 议 ”上 且 . 
上 述 厅 “JJ AL/JtHNHJ AL ALL CIL TRNAT， (7ZHNHJUL 二 < J TI PC 帮 XE 


非 随机 的 ,因此 才 有 (1. 13) 和 (1. 14) 成 立 ， 有 人 可 能 认为 这 个 假设 不 太 合 
理 : 战 争 中 被 俘获 (或 击毁 ,下 同 } 的 敌 军 坦克 数目 应 是 随机 的 .因此 另 一 种 


假设 是 ,共有 N 辆 坦克 ,每 辆 被 俘获 的 概率 为 m. 当 六 和 b 户 未 知 时 ,如 和 何 由 


数据 1 和 有 < 已 < 天 < 雪 N 来 估计 N? 
表示 被 俘获 的 坦克 数目 ,~ 是 一 个 随机 变量 


用 Et /人 HH 7 放 7 二 JE Lu 


俘获 ” 辆 . 易 知 , 当 1 委 i<z2<…<z 委 六 时 
人 
| 
一 】 


于 是 Pu =-ilc-o=( 人 4G 一 1， 2，…，N 一 ?72 十]) 
7 


一 ] 
己 (A， -ilrz= 六 = 人 人 全 ) (一 1 和 八 ) 
一 人 7 7/ 
从 而 ,和 (1.13) (1.17) (1.18) 类 似 , 有 
有 N( 允 | rz 一 0) 一 入 一切 入 m) 
天 N(W :| r 一 1 一 (一 切 Nm) 
而 且 若 VC ，…,R.) 满 足 开 NCOCR 和 …R-)|r 一 7 一 入 (一 切 六 过 , 则 必 有 
尼 NCCOCR 9 一作 ) :|r 一 ) 亏 EN(CCWV 一 N)2|r 一 站， 
换 句 话说 ,即使 把 被 俘获 的 坦克 数目 看 成 随机 变量 , 则 在 r=?” 的 条 件 
下 ,Wi 和 了 岁 : 都 是 入 的 “条 件 无 偏 估 计 ? 而 且 友 : 还 是 条 件 方差 最 小 的 “条 件 
无 俩 值 计 ”. 
以 上 再 一 次 说 明了 序列 号 方法 (用 历 : 或 叉 :) 是 有 起 理 的 . 


同一 个 未 知 参 数 的 估计 量 有 很 多 种 ,即使 是 使 用 最 大 似 然 估 


1 AT AP 入 A 有 -于 二 人 


计 ,样本 量 不 一 样 , 估 计量 也 不 相同 . 什么 样 的 估计 量 最 好 呢 ? 这 

就 涉及 估计 量 的 优良 性 标准 . 从 直观 上 看 ,自然 是 估计 量 与 被 估 

计 的 量 越 接近 越 好 . 但 “接近 ?二 字 的 含义 不 很 简单 ,有 深入 研究 
ee。 ]A 。 


的 必要 . 


设 入 的 密度 晒 数 为 大 CCZzyO)， 其 中 0 一 《0 9 0) 日, 晶 是 民 ” 
中 的 非 空 集会 ， 设 rz 从 且 0 的 瑟 针 Wo 有 且 双 的 样本 
Hi 下 广 -L TS 六 。 芝 gC0) 是 0 的 蝎 仇 ,Al A，， 3 民 了 1 AL 一 < HA T ， 
所 谓 g(0O) 的 估计 量 , 是 指 样 本 的 一 数 p(Xi，…X,). 9 的 不 同 选 
择 评 得 到 天 同 的 化 计 姑 直 JI 上 王 YY AR AN YN db 7 
JJ 由 可 寺 J- 人 天 3RNJIDN7IE 和 AL_L 全 ， |o(CXi 》 9? < 人、 怕 、 UVL iiANCL JJ ，? 


p 就 越 好 . 但 是 pC(Xi:,…,X,) 的 值 是 依赖 于 样本 值 的 , 它 本 身 是 
随机 变量 ,而 g(0) 是 未 知 的 . 所 以 评价 估计 量 的 优 劣 不 很 简单 , 需 
要 格 量 优良 性 的 标准 . 当然 这 种 标准 不 是 唯一 的 ,从 不 同 角度 出 
发 可 提出 不 同 的 标准 . 

由 于 样本 X, ,…,X, 的 联合 密度 函数 (或 概率 函数 ) 与 有 
关 , 故 p(X ，…,X,) 的 期 望 与 96 有关 ,有 时 记 为 Bop (Xi ，…，X，)， 
O(CA1 的 六 闫 记 届 Vaor rnMN 了 ) 


,入 ，) FA A 志 YL Y OO、<i9 了 之 色 斤 。 


定义 2.1 称 p(CX; ,…，,X,) 是 5(0) 的 无 偏 估计 ， 若 


了 YY 时 厚 


三 


AAA 全 分 3 7 丰 了 
人 .六 国 全 


Fi[p(X ，…,X,) 一 g(9)] 为 op 的 均 方 误差. 
显然 , 均 方 误差 越 小 , 佑 计 就 越 好 当 p 是 无 偶 信 计时 ,9 的 
均 方 误差 就 变 为 o 的 方 益 了 . 
定义 2.3 若 oCX，…X) 和 wm(X…X) 都 是 85(0) 的 估 
计量 , 且 ool )<AMo(Cp: ) (一 切 0OG 二 ) , 则 称 W1 不 次 于 Y2 , 此 时 重 
还 有 0 使 得 Me 《pl )<< AM 《pz )， 则 称 1 比 2 有 效 ， 


到 


例如 g(b) 一 EX 时 ,又 一 - 工 > X 是 g (6) 的 无 偏 估计 且 
乞 


肌 人 7 忆 广 玫 本 本 17 开 廊 玉 1 。- 豆 严 人 全 。 的 DPC Va Ar % ni 
Me(X,) 一 Vare(X) 一 一 Vare(X) 不 难看 出 ,只 要 0<Varo(X)< 到 
co , 则 驴 X ”有 有 郁 立 加 当 从 ， 1 时 ”一 上 S 后 一 
了 “1 CR PT 一 电 人 ”人 个 AR7 了 -个 : ~ 闻 | 7 LU AI 忆 彤 
] 1 


> ,AiX, 都 是 由 样本 得 到 的 EX 的 无 偏 估计 , 且 wm 不 次 于 mw. 若 
1，…，,)， 不 全 相等 , 则 pl 比 pz 有 效 . 
。 028 。 


因为 均 方 误差 是 2 的 盟 数 ,两 个 全 计量 并 不 一 定 总 能 比较 优 
劣 . 在 绝 大 多 数 情况 下 ,不 可 能 有 不 次 于 所 有 全 计量 的 佑 计量 , 即 


友 丰 在押 广 刘 关 旦 小鬼 仁 计 有 因 册 在 和 确证 仁 计 的 优良 性 标准 
“有 人 人 伺 记 刀 孜 过 上 皮 个 HRJIRO 旦 由 此 人 任 呈 IRIERJU 区 外 1 诺 


时 ,往往 不 得 不 缩小 范围 ,例如 在 所 有 无 伸 佑 计 中 找 方差 最 小 的 . 


-~ 性 TI AT 了 方差 种 了 


设 X，…X, 是 X 的 样本 ,下 述 定 理 给 出 了 方差 Var' (XI) 的 
一 个 无 偏 估 计 . 











Ia TI 人 了 站 拉 太 一 -< 本 也 / 甩 关 \ -一 -- cd ] < 
定理 2.1 方差 Var (XI) 和 全 在 ,3 一 一 2 一 
-ii=1 
| 
到、 /、 mr 1 所、 一 一 fearT、ANv 7 
放 主人 一 让 玫 全 岂 ， 则 | 是 Vare( (A%) 的 无 情 信 计 ， 芳 
1 
上 ,9 Var (和 从) 
证 明 NI 丙 2 一 人 W_ UN 
AI LN、 人 < LA 7]/ AAA LANWLA 7 
i 一 1 1 
- 瑟 上 且 . 
JJ 全 
他 
PiS: 一 -PEIX; 一 一 _ 忆 ( 刺 ) 
帮 二 To 


(X) 十 (下 X): 一 Var(X) 一 (下 X)2 








从 强大 数 律 知 ,S: 是 Var'(X) 的 强 相 合 估计 . 
定义 2.4 设 pCX，…'X,) 是 5(C0) 的 无 偏 佑 计 , 且 对 一 切 无 
偏 估计 VCX ，…X) 均 有 AM Co 委 M CO (一 切 0), 则 称 o 是 g(0) 
的 (一 致 ) 最 小 方差 无 偏 估计 . 
“最 小 方差 无 偏 估 计 ? 就 是 一 种 最 优 的 估计 量 , 它 在 很 多 情况 
下 确实 存在 ,当然 也 有 不 存在 的 时 候 . 有 时 无 偏 性 标准 显得 不 合 
ee 0]00 。 


理 ( 参 看 后 面 的 例子 ). 还 有 别 的 优良 性 标准 ,如 贝 叶 斯 标准 ， 
minimax 标 准 等 等 ,这 里 不 介绍 了 (参看 第 七 章 ). 


/局 柱 得 和 到 (K( 一 臻 ?最 小 方差 天 偏 仁 计 嘱 ? 这 不 是 容易 的 
心 件 何 土改 一 二 /下 小 分 下 抱负 人 人 于: 辽 人 小 征 谷 殉 时 和 雪 ， 而 


要 具体 问题 具体 分 析 , 没 有 一 个 普遍 适用 的 公式 . 但 在 20 世纪 50 


Ar 《IT re mA TD1 _ fr TO、 人 = 了 桔 一 b 四 ,|、 
-全 ] JJ 吕 y Blackwell 一 Lehmann 一 Scheffe 理论 为 于 寻求 最 小 方 


老 无 偶 佑 计 有 重要 的 指导 作用 ,这 个 理论 的 严密 论述 涉及 测度 论 
等 较 深 的 数学 工具 ,这 里 只 从 方法 的 角度 作 一 粗浅 介绍 . 为 此 先 
介绍 有 广泛 重要 意义 的 概念 一 一 充分 统计 量 . 
定义 2.5 设 X，,…,X, 是 来 自 总 体 F(z;i0) 的 简单 随机 样本 
(OE 9) , 称 U 一 p(X 和 …X)Cp 可 以 是 向 量 值 的 函数 ) 是 0 的 充分 统 
计量 ,各 X ，…X, 的 联合 密度 函数 (或 概率 函数 ) 世 (zi ，…,ze30) 有 


从 人 在 下 
/ 刀 州 FJ 


册 


1 (Zi 9?”” ”9 ;0) 一 9qLo(GCzi 9 ) 并 ，) ,0 凡 (i 9 ) 工 ，) (2. ] ) 


(一 切 O 人 9) ,其 中 几 (。) 是 不 依赖 于 0 的 非 负 枯 数 凯 . 
充分 统计 量 的 意义 在 于 : 它 概括 了 样本 zi,…，,z, 中 关于 .0 的 
企 站 人 传 自 了 人 在 仕 计 pH 人 人 利用 交 人 从 统计 最 有 四 [ 而 不 必 再 . 


一 一 Fi He /AH TY 疡 \ vv7IBJ9 了 LIIJAIJLALLAA AL FF -AT 


考虑 (zl ，…,Z 工 ). 例 如 ,和 若 人 1 9 ”9 导 1 是 两 点 分 布 B(k1,p) 的 简单 


随机 样本 , 则 易 知 U = > z; 是 b 的 充分 统计 量 . 估计 思 时 ,只 需 知 


道 怀 次 试验 中 的 成 功 次 数 即 已 足够 ,而 不 必 再 关心 具体 的 哪 次 成 
功 人 zi 一 1) 哪 次 失败 (z; =0). 从 (2.1) 看 出 ,0 的 最 大 似 然 佑 计 如 
采 存 在 , 则 最 大 似 然 估 计 一 定 是 充分 统计 量 的 函数 . 


可 以 证 明 , 充 分 统计 量 有 下 列 明确 的 概率 意义 :对 任何 随机 事件 4 和 XI，…， 
Xna)EA} 及 zx, 条 件 概 率 PC(CXI，…，X)EA|opCXI，…X) 一 zxo) 与 0 无 关 ， 
实际 上 ,有 更 强 的 结论 :为 了 U=op(CXi ,…，X) 是 充分 统计 量 ,必须 且 只 须 上 述 条 


所 二 一旦 了 Sa 


件 概率 与 0 无关 . 这 就 是 有 名 的 Fisher- Neyman 因子 分 解 定理 ， 在 一 般 书 上 把 上 述 条 
作 委 兴 与 9 3 要 注意 的 是 ,上 还 条 件 委 尝 个 很 何 生 ， 因 


充分 统计 量 的 直观 意义 是 它 关 括 了 翌 本 (总 9 ” ,X ) 提 供 的 信息 . 
。 30 。 


从 上 述 充分 统计 量 的 定义 容易 寻求 充分 统计 量 . 
例 2.1 指数 分 布 . 
密度 明 数 是 


三 ZA) 一 一 了 co) ( 芝 )Ae 和 "人 和 (0 ,co ) 


了 


其 中 丰 (Cz) 是 集合 五 的 示 性 晒 数 . 
md -水 -7 AR WAITH 和 人 ET 有 洲 『r 半 ， 
JLNJT1TPFO YN、 人 < 人 13? ?< 人 n7 DJ DDNXA AL 


办 


| Ac ya) 王 | 


1 








| | 
了 1o,- (Zi)。 he “2.5 


与 (2. 1) 式 对 比 知 ，p(X 和 …,X。) 一 YX 是 ) 的 充分 统计 量 . 








例 2.2 正 态 分 布 . 
密度 函数 是 
] ? 
六 z3m7n 6) 一 了 exp| 一 二 (一 站 
\V2TG 2 ) 
中 wE coco),0G (0co ). 
7 ] ] 
几 Axiso)= -( 二 ) exp 人 一 吉 习 Cr 一 0 
1] >” ( ] 元)3 
一 eX 一 (Z; 一 并 
5 pi 一 0 
) | 
十 7 人 立 一 久 | 


其 中 工 一 工 >x. 可 见 ,oCA: 入，) 一 (又 ， > (从 ， 一 闷 ): ) 是 (/A， 


5) 的 充分 统计 量 . 同 理 知 , ( 》\X ,》2 ) 也 是 (6) 的 充分 统 
】 】 
计量 . 
例 2.3 指数 型 分 布 . 
密度 函数 (或 概率 函数 ) 是 


Hz,g) = SCO)hCz)exp{f CGOTCz) | 
& 一 1 本 
其 中 0 一 (0 和 0)JEB,SCO)>0,Az) 二 0,B 是 m 维 欧 氏 空间 中 


睛 和 于 储 
HJ AT 条. 


许多 常见 的 分 布 如 指数 分 布 . 二 项 分 布 、 了 Poisson 分 布 、 正 态 
分 布 等 都 是 指数 型 分 布 (请 读者 自 己 验 证 ). 
此 时 样本 (Xi ，…,X， ) 的 联合 密度 函数 (或 概率 函数 ) 为 


计量 . 
例 2.4 均匀 分 布 ( 不 属于 指数 型 分 布 1). 
密度 函数 为 





Hziay) 一 TaCz) 开 
这 时 ,样本 (Xi ，…X,) 的 联合 密度 函数 为 








他 ] 六 | 
TI Aroa=( 产 二) 工 To(zo 
1 1 
(- 工 YYT 
一 1 CCmnin Zi) (Cnmax ;1) 
\8 一 a/ 
可 岂 GO 入 1 )…A) 一 (mlin 入 ;， X 入; ) 是 (a,p) 的 充分 统计 量 . 
充分 统计 量 概括 了 样本 中 所 含 未 知 参数 的 信息 充分 统计 量 
不 目 - 一 个 LAnmde -和 TTW  。W ) 就 是 未 知人 参数 的 一 个 充 
不 止 一 个 ,例如 祥 本 本 喘 ( 人 XI，…X) 台 证 未 知 参 效 的 充分 统 


计量 (这 从 (2. 1) 直 接 看 出 )， 什 么 样 的 充分 统计 量 最 有 价值 呢 ? 


显然 ， 充分 统计 量 po 王 (DLA “入 ， ) OA ” ， 从， ) ) 的 维 数 
/ 越 小 就 越 有 价值 ,因为 我 们 用 尽 可 能 少 的 量 概括 了 样本 中 提供 


fi 


的 信息 .例如 设 样本 值 = ,…',z, 来 自 正 态 分 布 ,我 们 可 用 两 个 量 
5 工 >) (zx, 一 瑟 : 来 概括 个 原始 数据 提供 的 信息 .以 上 的 几 个 


ee 3 了 2 。 


例子 里 都 存在 降 维 ( 即 维 数 小 于 样本 量 ) 的 充分 统计 量 ; 而 且 不 管 
样本 量 多 么 大 ,永远 有 维 数 与 未知 参数 个 数 诅 等 的 充分 统计 量 , 这 


到 包 且 好 十 
人 人 


但 要 注意 的 是 ， 并 不 是 任何 分 布 族 永远 有 降 维 的 充分 统计 量 


全 | 有 区 包 失 让 在 名 外 在 上 甘 和 人才 这 尖 炎 | 
例如 着 名 的 韦 布 尔 分 布 ， 7 


人 工 ; 7 77) 一  ， _(z) 矿 ee mmiexp| 一 / 工 、 | 
iD A7 了 /上 


ee 


(m>0,7>0). 可 以 证 明 , 当 yx 之 3 时 任何 统计 量 gw= (pl (Xi ，… 
水) DA 和 ,入 ， ))L< 7 都 不 是 (mm 人 的 充分 统计 量 
还 有 一 个 重要 概念 是 所 谓 完 全 性 . 称 统计 量 p(Xi ,… 的 


完全 的 , 若 对 任何 (Borel 可 测 ) 函 数 x(。), 只 要 已 xfro 


L 二 9 -人 人 JJ LI 7 ES 双人 UL 人 /9 AN 区 二 bg2 LOD、 
hnT ON YYr 田 P 用. 后 佐 上 娄 1 相应 的 4RT 浪人 上 万 HR 和 汕 0 


ZL 民生 -2 多 LU 相应 的 概率 ,, 是 -0 414 HJDA 一 


望 . 
可 以 证 明 ,前 面 几 个 例子 中 给 出 的 充分 统计 量 都 是 完全 的 . 例 
如 , 行 Xi，…X, 是 两 点 分 布 咏 (1，, 刀 ) 的 简单 随机 样本 , 则 0 一 


浊 


上 从 一 
9 服从 一 


村 
Fr 


项 但 布 DPI AN 十 4 工 全 f 、 世 
-人 /JR HL、 9 AL 


加 
外 


/av 
用 J。 -大 9 


数 wx(.) ,如果 Eu(p) 一 0( 一 切 训 E (0,1))， 则 > vtbci2， (1 一 
放 一 一 0( 一 切 E (0,1)). 令 y= 2/(1 一 , 则 对 任何 yE(0， 


ce) 有 za(E)Cty =-0. 但 此 式 等 号 左 端 是 y 的 多 项 式 (次 数 不 超 


过 , 故 必 有 xz(E) 一 0GR 一 0,1,…，,m). 即 po 是 完全 的 . 


TTNT3SEHB : 急 全 类 0 的 华人 月 右 内 点 前 [5 尖 其 丰 旋 HH 上 OO 
LA 人 和 2 多 的 集合 -有 YAN， 人 Jj 日 又 /JR ATRJ AL 


挟 


分 统计 量 9 一 (之 /了 CDOT ) ) 是 完全 的 . 
下 面 不 加 证 明 地 叙述 Blackwall -Lehmann - Sheffe 定理 它 
的 证 明 涉 及 较 深 的 数学 工具 ,需要 条 件 期 望 等 概念 . 
Blackwell - Lehmann - Sheffe 征 理 : 知 OCX ，… Xu) 是 完全 的 
。 33 。 


3 


充分 统计 量 , 氏 p(X ，…，,X,) 是 g(0) 的 无 偏 估 计 , 则 4LPCX 
X,)] 就 是 8(0) 的 最 小 方差 无 偏 估计 . 


季 [[ 困 > 立 人 个 rTHRETT 4 下 各 右 间 上 的 4 姓 昌 全 [nm 对 正 态 分 布 
4 。w 岂 人 二 人 全 开 Jr 让 2 月 心 人 入 有 JJ 有 和 个 DJARNAOAJ JANE 


Noz) 而 言 ,样本 均值 束 是 wx 的 最 小 方差 无 偏 估计 ,样本 方差 
xi- 闷 ): 是 的 最 小 方差 无 偏 估计 . 在 可 靠 性 工 


程 实践 中 有 下 列 问题 : 设 X 一 NGCoso )，wsoz 未 知 ， 如 何 根据 样本 
值 zx: ，…，Zz， 找 出 概率 PC(CX>c) 的 最 小 方差 无 偏 佑 计 ? 经 过 


TEL 人 7 7 “由 2 


Kolmogorov 的 涂 刻 研究 (1950) ,得 到 PCX>c) 的 最 小 方差 无 偏 估 
计 wz yz 如 下 :， 


OZI1 9 ””” 9. 亿 ) ) -一 | 2 (&)dx(7 2) 


”一 








其 中 
1 \、 wakc 一 元 ) TS 
加 [ 芭 71 1 
一 一 气 人 人 
VPC 
1 


1 
1B( 去 性 ) 


B( 访 ， 0 一 | xz 一 zmdz 


(1 一 邓 ) 写 ， zz 委 1 





对 于 两 总 体 情 形 : X 一 NOayal)， 诗人 人 (ma ,02 ) 且 入 与 Y 独 
立 , 如 何 佑 计 P(X>>Y)? 这 是 工程 结构 可 徘 性 研究 中 很 重要 的 问 


设 X 的 样本 是 Xi;， 并 的 样本 是 Z，… 了， 


we LA 


当 ”一 7 时 
和 1 一 YX 一 Y， 是 X_Y 的 样本 ,可 用 上 面 介 绍 的 公式 来 估 


计 P(X 一 Y>0)( 即 PC(X>Y)); 当 7 六 如 时 ,如 和 何 找 出 已 


下 从 L 生 有 -vv AN NA AAA Au IJ ?9 NT JJ JS LILI 


的 最 小 方差 无 偏 估 计 ? 这 方面 也 有 估计 公式 ,是 20 世纪 70 年 代 
蕊 得 到 的 . 公式 较 索 ,从 略 . 
关于 无 偶 佑 计 , 我 们 指出 它 有 时 不 存在 . 
。 34 。 


例 2.$S 设 区 服从 二 项 分 布 B(a ,0)(0 委 9 委 1)，, 即 


PCX 一 及 一 (2 050 一 0 (有一 0 ,1 作 ) 


我 们 指出 g(0) 一 革 挛 没有 无 偏 估计 
实际 上 , 若 &(X) 是 《7 的 天 信 信 计 ( 现 在 梓 本 是 1) , 则 


Fi& (X)= 王 8(0) (一切 0). 于 是 > 8( 说 CT 一 0 一 反 一 (0<0 
0 


[一 


委 1).， 此 式 左 问 是 0 的 多 项 式 , 而 右 端 却 不 是 ,不 可 能 在 L[0,1」j 上 恒 


秘 人 宪 人 了 予 夺 主 H rrON 省 右 工人 (二 
= 了 于。 过】 放 站 人 网 bAU/ 人 月. 作 呈 7， 


我 们 强调 指出 ,不 要 把 无 偏 性 要 求 看 得 过 分 重要 . 无 偶 性 是 
大 量 重 复 使 用 同一 估计 量 时 应 该 尽量 满足 的 要 求 , 根 据 现 有 数据 
进行 一 次 性 估计 不 必要 求 什 么 无 偏 性 . 有 时 无 偏 性 的 要 求 会 导致 
很 不 合理 的 结果 . 

例 2.6 设 X 服 从 Poisson 分 布 , 即 

记 (CA 一 R) 一 beere( 有 一 0， 1，… 0 0) 


Ri 
-20 :由 
。 芭 


ye 疝 0 一 六 一 1)4 站 8 (9 人 0) 


& 一 0 


从 而 6(R) 王 (一 1)(R 一 0,1,…). 这 就 是 说 ,g(0) 的 无 偏 估计 只 有 


LA 人 一 区 UL 人 了 


一 个 : 当 观 测 值 是 偶数 时 用 1 全 e “，, 当 观测 值 是 奇数 时 用 一 1 
估计 e-2%， 这 个 估计 量 显然 是 不 合理 的 ,因为 g(6) 之 0, 可 是 估计 
量 &(X) 有 很 大 概率 取 值 一 1. 
对 于 无 偏 估 计 来 说 ,当然 是 方差 越 小 越 好 . 可 是 当 样 本 量 一 
定时 ,估计 量 的 方差 不 能 任意 小 ,而 是 有 下 列 闭 名 的 下 界 不 等 式 . 
se。 3 了 0D 。 





这 里 06 是 参数 ,geE (a,0) (一 co 和 受 a<bo 和 co). X ，…,X 是 X 的 样 
-小 wo WA\ 目 roNt_ 个 工人 人 日 泪 吕 下 万 | 站 涉 
本 ，V0( 入 1， ”人 人 17 三 忆 \ 7 RJ 1 AL VH ID LA T 7 JJ 入 II 工 
条 件 : 
(1) 巨 一 (zx:FGz,0) 和 关 0)} 与 0 无 关 ， 
(2) g' (0) 和 5 汪 ' 亿 都 存在 且 对 一 切 g 有 
| ”下 ktz:2dz =0 (2. 2) 
| 一 六 dz 一 
”| 日 (II7er ojdz 一 0 (2.3) 
J 一 co J 一 co QU 
df= Poco 二 
LLUVJ 一 co J 一 co 可 
fco fco 
一 | 大 JE) 寺 II 7cr ,dz (2.4) 
(这 里 及 下 面 恒 记 蒂 一 (zl，…,Zn)， “dz ). 
(3) ICO) 三 | 人 PCzyb)dz>0 
JEAN db “ 
则 有 下 列 结论 
Varn(pCX me XD)2[E CO (2.5) 
”MT(CO) 


Cs 2 人 


意 条 件 (2) 表 示 积 分 号 与 微 商 号 


对 
和 色 
汶 
党 
包 
距 


: 注 
| … 下 TEL /zi0)dz=1 ,7 之 1). 


当 TO 或 者 V ar; 《4W 信 1 。， 久 ) ) 一 


< 


CO 2.5) 显 匈 
以 下 不 妨 设 T(0) < co 且 Var (CU < ce. 由 无 偏 性 知 g(0) = 
jc ] Ar ,0)dz ， 从 条 件 (2. 4) 知 


(IIye ,0) dz 


-上 L _JL 


g'C0= | …| oz) 也 
J 己 2 人 d0 


。36 。 





,.， | 
JE JE ) 了 | 
P P 站 d 
-一 .| (zz) | 三 ( 工 ， 0) 。 一 《 《mn 太 ( ,0) 1 dz 
JE JE ~ 人 dd0 
另 一 方面 ,从 (2. 3) 知 
f ...f TT md 


一 Var (CuW) 。 E,(》Y) (2.6) 
其 中 
Y=ACXD)， hz 一 [ln FCz,0)] 
从 (2.2) 知 EoY;= 一 0, 从 条 件 (3) 知 孔 巡 一 T(0)， 又 思 YY， 


相互 独立 , 故 马 ( 》'Y;) =xT(6) . 从 (2.6) 直 接 推 知 (2. 5) 成 立 ， 
证 毕 . 
不 等 式 (2.5) 就 是 著名 的 C- 了 有 不 等 式 . TO 叫做 Fisher 信 


FA， mg 本 -和 一 一 喇 一 本 


息 量 ， 对 于 离散 型 随机 变量 也 有 类 似 的 不 等 式 ,只 不 过 在 推导 过 
程 中 要 用 求 和 号 代 革 积分 号 . 


达到 不 等 式 (2. 5) 右 病 下 界 的 无 侦 佑 计 最 引 人 重 视 , 在 一 些 较 
委 了 7 和 


时 的 书刊 中 称 之 为 有 效 估计 .显然 ,如 果 它 存在 ,一 般 就 是 最 小 广 
差 无 偏 估计 .但 是 它 不 一 定 存在 . 换 句 话说 ,C - R 不 等 式 给 出 的 


下 因 右 时 计 人 小. 
T AT 柯 ”JJ 人 三 


例 2.7 议 从 一 Na )0 已 类 ， A 未 知 . 入 ，…， 人 及， 是 样 


-本 下 2、\ 上 稳 D 
本 . 记 A 的 密度 为 上 (zjpyo ), 易 知 





9ln jzypso ) 工人 一 ，) 
9w 2 帮 … 
于 是 TIG0OD = 工 | (zz 一 Dzze)dz 一 二 
o#j-- 0 
了 | 一 0 _ 由 入 
记 XX 1 XX. 则 瓦 和 一 Ap Var (X) 一 一 HT 可 见 尺 
的 方 益 达 到 了 C__R 不 等 式 给 出 的 下 界 
一 rr 口 口 -二 一 人 大 一 IT 2 AL AT AT ES ] < \D 上 一 Ac 
可 区 证 列 : 自 4 已 知 , 则 5 的 们 计量 二 2 一 Ap) 的 方 老 
1 
达到 志 - 有 不等式 给 出 的 下 界 
例 2.8 设 和 服从 伯 努 利 分 布 , 即 
P(X 一 1) 一 1 一 P(CX=0)= 六 (0<p < 1). 
IT NE 有 泣 r 半 ， 
JU 人 DJ 人 PMAL 
太 z 四 ) 一 因 (1 一 四) (z 一 0,1). 
易 知 -CCln FCz,p)) 一 工 一 -一 工 ,于 是 
/一 了 
< d， 12 1 
元 加 ) 一 之 /17zt)) GZ 力 ) 一 一 
z 一 0 \、 “人 | PN\L 万 /) 


又 的 方差 达到 了 C - R 不 等 式 给 出 的 下 界 
例 2.9 设 X 服 从 Poisson 分布 , 即 


e。 3 了 6 。 


其 中 是 未 知 的 正 数 . 我 们 要 估计 g(CA) 一 e“. 


取 g(GA) 的 无 偏 估 计 
加 ] _ ] \2x 
2 一 | 元 贱 
(Xi ，…,X, 是 样本 )， 它 的 方差 为 e-2% (er 一 1). 由 前 面 介 绍 过 的 


| 一 人 一 -2 一 


Bljackwell - Lehmann - Scheffe 定理 ) 亡 是 人 (A) 的 最 小 方 差 无 偏 售 


一 =- 二 < 二 


计 . 但 C -R 不 等 式 给 出 的 下 界 为 一 e- ”9 它 小 于 Varn(&), 这 说 明 


C-R 不等式 给 出 的 下 界 不 可 能 达到 . 

在 统计 学 中 常常 要 考察 统计 量 的 大 样本 性 质 , 即 当 7 很 大 时 
统计 量 PC(Xi ，…X,) 的 性 质 . 这 一 点 在 8$ 1 中 已 提 到 过 ,那里 说 
的 相合 性 就 是 大 样本 性 质 . 相合 性 的 一 般 定 义 如 下 . 

定义 2.6 称 估计 量 wo, (Xi ,…,X,)(nz 亏 1) 是 g(0) 的 相合 估 

lim 已 (| g。 一 有 


定义 2.7 称 估计 量 wo, (Xi，…，,X,)(z 之 1) 是 g(0) 的 强 相 合 


从 量 姑 邹 委 和 知 . 币 仕 计 一 艇 县 有 蝇 
二 


最 大 似 然 估计 在 十 分 广泛 的 条 件 下 也 是 有 强 相合 性 的 ， 参看 
文献 [2 

现在 就 单 参数 情形 给 出 一 个 定理 . 

定理 2.3 设 X 有 密度 函数 f(z,b) ,其 中 66E (a, 六 (一 co 委 a<6 委 co)， 


且 满 足下 列 条 件 : 
〈(] ) 对 一 切 0 二 六 ， 
ptTZ:Czyp) 二 0 且 Frzy 0) 失 FCzyo)) 0 
这 里 “表示 Lebesgue 测度 . 
ee。 39 。 


(2) 似 然 丽 数 直 (zi ,zu;b) 一 ITyez ,0) 是 6 的 单 峰 函数 ， 即 存 在 


DO 一 A (Z1 9 ， 工 ，) 使 得 了 (Zi 9 “”””9- 忆 1 ; O) 和 Co ] 上 严格 增 ， 在 [局 )D) 上 六 入 减 
的 强 相 合 估计. 


证 明 :从 似 然 函 数 的 单 峰 性 假定 知 ,最 大 似 然 估计 0 一 太 (XI 3;X) 存 
在 昕 唯一 . 下 面 证 有 明 它 具有 中 相 合 狂 交 了 了 和 共生 和 焉 密 的 和 讨论 秩 们 个 这 女 
小 二 L 续 HU RL “JJ 世 和 有 JTJ JI DJPFJICI9TTUTHJIE DC 人 1》 


, “是 概率 空间 (0,9, Po)(6E (a， 0)) 上 相互 独立 且 同 分 布 的 随机 变量 列 ， 
非 空 集合 (由 人 全体“ 基本 事件 ?组 成 ) ,多 是 吕 的 一 些 子 集 ( (随机 事件 ) 


LA TA EL 了 了 


组 成 的 cc 代数,P, 是 终 上 有 定义 的 概率 测度 旦 P,(X,<z) 一 | zyg)dz. 


与 9 相应 的 数学 期 望 用 E, 表示 
任意 固定 加 GE(ayp). 到 ~、oo -12 .9) 满 芭 limn 08gdL EC 
Cab. 利用 不 等 式 In z<z 一 1(z>0 且 zx 于 1) 及 条 件 (1) 知 


< 人” re 女 z, 甸 士 in)d。 





一 一 ~ 全 之 9U0O 7/【i dz <0 
」 -~ 太 ZyOo ) 
加 T『， COX 2 士 o) 
5 入 6 [ 三 Al ,0 ) | 
人 ao 时 一 涛 fr 人 十 4 
LN JR 人 艺人 1 和 人 HH 
PpP 1 工 SNILLX, 士 oo)_ Fi KKX, 如 士 o) 1 
% mn 记 全 大 Ai O0 ) 1 帮 A: 00 ) / 
于 古 有 
pp 1， ICX Xi 士 扣 ) 一 ljn 工 XXXi0) -| 
Lam 一 二 


本 允 

故 有 集合 个 。 三 6 (4 ) 一 0，, 当 wEAn 时 

。 ln 亏 (XI 区 ;0 士 O) 一 jnZCXI…， An;00) 
]m 一 -一 一 


< 0 
妨 他 
(注意 入]1，… 及， 都 是 w 的 函数 ,wE2). 
于 是 有 xz (o) , 当 2 之 zzr Co) 时 有 
人 (和 从， ;0 十 )< 了 (和信 ] ，，。， 人 入， ;00 ) (2. 7 ) 
人 、 | | ， JRDPD (YAN 一 rr 一 A 口 亚 ~ 僵 ，( NII2 7\ cq 
于 人、 mm 9 7AS 00 LV7 vs AI IDU 忆 UL AAA 人 1 一 二 信人 7 /人 


的 年 硬 作 和 印 最 天 似 然 伯 和 人 0， 在 (和 一 各 ， 旬 十 各) 内 ， 有 
性 . 证 毕 . 


4 人 全、 
Im Yi / 


四 


R&Q 古人 位 尽 疝 7 
yo -一 | 甩 二 1HJAVIC 


< 


设 zj, …*yz 是 样本 值 , 前 面 讲 的 是 几 一 个 量 pCzry，…，Zznv) 
(《 估 计量) 去 估计 未 知 参 数 的 函数 g(0). 换 句 话说 ,用 p(Czi，…， 
zu.) 作 为 80) 的 近似 值 . 读者 可 能 不 满意 ,到 底 估 计 值 与 真 值 相 差 
有 多 大 ? 这 是 个 很 重要 的 问题 ,统计 学 家 力图 给 出 回答 . 这 个 问 


题 与 估计 量 作为 随机 变量 的 概率 分 布 有 关 . 


ce 卫 1 三 
外 [只 ae 用 CA \v9L]/9PDIN\L19? “9 LA A INH 仿 2、< 人 1 9 9 LA1 A 人 弓 
两 个 统计 量 ,wm 委 m. 称 Lol,p 是 g(0) 的 置信 水 平 是 > 的 置信 区 


PT 7 一 TI SI 了 m 六 .二 -一 
1 本 5 记 . | 本 1 计 ), 行 对 一 切 7 


P{o (XIXD< EC) 二 m(X wyX))7  (3.1) 


置信 水 平 也 称 置信 度 ,种 取 7 一 0.80,0.90,0.95,0.99. 符 


(3.1) 式 的 左 端的 下 确 嚼 功 人 恰好 是 >, 则 称 > 为 Lo ,ez 的 
置信 系数 

置信 区 间 Lep ,ep: 的 好 处 在 于 : 它 以 一 定 把 握 保 证 g(0) 在 此 
区 间 中 . 

在 (3.1) 中 的 ol ,wo: 分 别称 为 g(0) 的 置信 下 限 .置信 上 限 . 在 
某 些 问题 里 只 关心 填 信 下 限 ,此 时 取 o: ; 在 另外 一 些 问 题 里 


只 关心 置信 上 上限 ,此 时 取 0D1 一 ”oO 
寻找 重信 区 间 是 一 件 重 要 的 工作 ,当然 应 该 限于 寻 拷 1 
Co ， 


一 人 


置信 区 间 . 若 不 管 优 良性 , 取 科 三 一 co ,os 一 co,[ 一 


ec(0) 的 置信 水 平 为 yy 的 置信 区 间 读者 一 眼看 出 这 个 置信 [1 
已 \、 vvI7RNRJ_EL IRON JJ 有 1 | 全 和 FJ 。 玫 愉 “有 LU 人 一 -EL 月 一 1 


毫 无 用 处 , 它 没有 提供 g(0) 的 任何 信息 . .什么 是 优盘 的 置信 区 间 

呢 ? 这 就 涉及 优良 性 的 标准 . 有 多 种 不 同 的 标准 ,我 们 柱 这 里 暂 

不 进行 深入 的 讨论 ,只 是 指出 :优良 的 置信 区 间 应 该 是 区 间 长 度 
e。 4 。 


( 即 w: 一 2 ) 比较 小 (如 果 只 关心 置信 下 限 , 则 这 种 下 限 越 大 越 好 ; 
如 有 果 只 关心 置信 上 限 , 则 这 种 上 限 越 小 越 好 ). 


赤 考 白 包 会 间 . 为 什么 在 定 义 3.1 中 (3 1) 式 里 是 “之 ”而 不 是 
风电 到 上 /中 人 全 让 直入 也 \u 7 TI 士 1 “人 AXE 


“一 ”? 原因 是 , 若 要 求 “= ”号 处 处 成 立 , 则 在 许多 重要 情况 下 所 要 


由 万 BE 人 FE GT - 太 … 站 FE 名 -友人 了 > 洛 H 上 >iz 4 HE -上 -让 
求 的 置信 区 间 不 存在 . IAA /中 人 讨 信 妈 本 bo 力 达 NAN\。 局 各 女人 个 


找到 置信 系数 恰 为 y 的 置信 区 间 ( 或 置信 限 ). 

和 插 样 寻找 优良 的 置信 区 间 昵 ? 这 不 是 容易 的 事 , 要 具体 问题 
具体 分 析 . 有 三 个 一 般 性 方法 可 指导 我 们 对 具体 问题 进行 分 析 ， 
有 助 于 找 出 优良 的 置信 区 间 , 本 节 介 绍 枢 轴 量 方法 和 统计 量 方 
法 ,第 三 个 方法 是 借助 于 假设 检验 理论 的 接受 域 方法 ,将 在 第 三 章 


中 叙述 . 
况 生 从 和 包 芭 有 hh 县 十 尘 这 全 天 泪 月 六 I 征 钴 计 邮 出 明生 上 朋 上 上 山 
上 LA 1 凑 订 时 几 和 ?过 |】 /下 JJ 可 上 LIRJ9 
年 本 书 叙 述 的 重 反 . 


EL /一 I | 人 站 站 十 有 由 一 


为 了 寻找 g(0 的 置信 区 间 ,我 们 设法 选择 与 样本 人 ，… 用， 
及 gg 有 关 的 函数 关 (X ，…X。3g(0)) ,使 得 这 个 曙 数 (实际 是 随 
机 变量 ) 的 概率 分 布施 数 万 (z) 与 0 无 关 . 在 此 基础 上 找 人 <: 满 
足 万 WAz) 一 万 (AT) 之 >、 于 是 PC 委 关 (XXX3g8(CO0)) 委 1z) 之 
7. 解 不 等 式 1 委 PCz Zoo3Ud) 委 和 12， 得 到 oz zh) 委 vv 委 
pz (zi 和 Zn) 于 是 [ol (XI ，…，X,) oz (CX，…,X,)] 便 是 g(0) 
的 置信 水 平 为 7 的 置信 区 间 . 当然 ,A:,a* 还 应 选 得 使 这 个 置信 区 


TOO 芝 诺 尺 DTEA/ 
JR 这 人 人 能 的 小 . 


上 述 的 AX，…，X5g8(C0)) 一 般 称 为 枢 轴 量 (Pivotal) ,和 它 的 


精确 分 布 与 未 知 参数 无 关 如何 找到 合适 的 枢 轴 量 就 是 问题 的 关 
键 . 我 们 通过 几 个 具体 问题 加 以 讨论 ,希望 读者 从 中 理解 寻求 枢 
轴 量 和 置信 区 间 的 一 般 步 又 . 至 于 所 得 到 的 置信 区 间 的 优良 性 ， 
则 不 去 讨论 . 在 第 一 章 中 将 会 间接 地 看 出 ， 这 些 置 信 区 间 是 比较 


优 恨 的 ,区 间 是 "比较 短 的 ”. 
(一 ) 指数 分 布 


密度 函数 是 fGz,A) 一 To (Crz)Me ,其 中 是 未 知 的 正 数 . 
。42 。 


如 何 从 样本 Xi ，…,X，, 找 出 ) 的 置信 区 间 ? 
从 $ 1 知 》 的 最 大 似 然 估 计 是 z/ > X,， 可 以 求 出 > X, 的 密 
度 男 数 为 
9CZA) 一 100) (人工 ) hnzr e 


(2 一 1)1! 
(读者 可 用 数学 归纳 法 验证 ). 


> 


中 中 己 


三 
J 疙 Hi 四 7 妈 正 


4 


贡 
A 人 人、 DAN1Ar 
一 LA 人 人 ii， 
1 





力 (Zz) 一 2"TCoD) 
0 ， Z< 0 
这 表明 大 是 一 个 枢 轴 量 , 它 可 用 来 找 ) 的 置信 区 间 . 
定义 3.2 称 随机 变量 服从 二 个 自由 度 的 :分 布 , 若 它 的 密 
度 函 数 是 这 样 的 : 
0， Z< 0 


轧 ,(Z) 一 4 1- er 到 ， 立定 0 《3. 2) 
22 (号 ) 
其 中 Roy) 一 | mev*dx(a>>0) 是 一 图 数 . 


2 /全日 和 aa | 目 二 HA AAA _w FEH As AH mv AAA 业 F 
多 人 分布 定 统计 字 中 地 和 宣 安 的 分 布 忆 一 ,用 古人 候 上 ， 巴 日 刀 人 SA 


表 是 一 个 常用 的 统计 表 @. 不 难看 出 ,上 面 的 枢 轴 量 上 疡 正好 服从 
27 个 自由 度 的 X 分 布 . 查 本 书 的 附 表 3 可 找到 ) < 满足 


P(<22X < )z ) 一 7y， 于 是 


@。 设 随机 变量 X 的 分 布 函数 是 FCz)， 给 定 0<p<<1. 设 zy 满足 PCX<zo) 
分 位 数 一 定 存在 ,但 有 时 不 唯一 . 


e。 4 了 3 。 











P| 2 委 ) 扫 一 汪 |=” 
[2 > X 2 > Xi | 
这 表明 
Ma 
2 


是 、， 的 置信 区 间 ,置信 水 平 是 7. 为 了 使 这 个 置信 区 间 之 长 度 最 
小 ,应 使 人 2 一 和 最 小 .… 可 以 证 明 1:yh; 应 满足 下 列 两 个 方程 
42 
| 户 ZJ)dZzr 一 7 
4 (AI1<A，) 
力 ?, (AI1) 一 力 ?(Az ) 
这 里 bz (z) 是 22 个 自由 度 的 X 分 布 的 密度 函数 , 即 如 2。 (z) 一 


上 __zo-lie- 到 (z0)、 第 一 个 方程 保证 置信 水 平 是 y, 第 二 个 方 





2 
程 保 证 )， 一 - ) 达到 最 小 值 . 


ZTC UL AZ As 开 JJ 7 


从 这 两 个 方程 就 可 确定 出 M; 和 ,但 在 实际 工作 中 这 样 做 申 


长兴 人 站 TO PE NA AN 和 9 s 
和 八 必 。 八 1 是 人 币 丰 放大 放 人 人 , 即 找 人 1 和 》， 满足 


An co 1 一 ww 


(和 ] 1 
| 力 , (Z)dz 一 7 虽 ，zo(z) dz 一 7 人 


而 不 去 追求 和 的 最 优选 择 . 
注 “ 我 们 可 以 证 明 下 列 一 般 性 命题 : 设 a(z) 是 (一 cy,co) 上 非 负 连续 函 
数 ,满足 下 列 条 件 : 








| PCZz)dZz 一 ] 
且 存 在 一 ce 委 zo<e6<co 使 得 Z 委 Zo 时 户 (z) 一 0, 在 (zo ,6) 上 (z) 是 严格 增 
函数 ,在 (#,co) 上 bz) 是 严格 减 函数 . 则 有 下 列 结论 ， 
(1) 对 任何 yxE (0,1) ,方程 组 
| aczdz=7 (a 忆 虽 (3. 3) 
轧 (a) 一 力 (D) (3. 4) 
名 4 4 各 


:TB 人 个 们 - 天 rr AN 央 交 nraora 雪 石 瞪 ApF 一 Pr 估 租 

LAJsA JTJ LN LOL 9 AL ~ 人 人 外 79 HR 记 红 荔 -J CC LN\CL /1 
全 

六 (5 一 六 (CC 网 这 个 po 县 的 连续 减 国 数 今 1 一 prydzr 而 

7 本 AAwyv AM 了 Am、 人 习 和、 ] 下 必 ] ae AAA 
a 


必 a) 是 连续 晒 数 ， 且 lim Ca) 一 | 力 (z)dz 一 1， ipn 见 (a) 一 0( 因 为 
Z0 CA 上 


他 一 


lim (ca) 一 龟 . 故 一 定 有 a”E (zxzo, 5 满足 Wea”  ) 一 7 令 久 三 ba ). 则 (co” ， 


GE 


5 ) 满 足 方程 (3.3)、(3. 4). 
若 (a,0) 也 满足 (3.3) 和 (3.4), 易 知 zeo<a<& 者 2a<a" ， 则 训 (a) 去 


为 (oa ) 一 六 0" )>](0). 于 是 0 六 .从 而 | 2z)dz > 上 力 (z)dz 一 y, 这 与 


7nm mAN Jr 一 PP 1 -0 一 全 本 o 用 人 人 人 7 1 、、 ”vv 二 一 基 是 一 
\J /让 站 上 呵 考 * 石 人 一 CA | ,人 ZLIQZ 一 YY 也 站 4 0 二 直 
[| 
rn nmN 了 FE tr 一， -Pt 日 II 一 HL SA\_ ra 4 人 人 大 [外 如 7 
\D。D/ Mi 六 和 站。HhHAC 一 CC yo 一 OO ?Ah 站 SHA D/ \JD。 条 /从 FF 比 ji 
{ 
全- 一 pp 一 rm* dg 一 prydr .中 一 pr 二 一 pr 二 县 
号 二 L & 子 太 玫 LA ] 用 咏 7] va 9 AAA 人 7 1 7/ ee JJ AL 
本 
风 (oa ) 一 六 (0 ) 一 六 aa) 一 0. 另 一 方面 , 当 a<a*” 时 车 ae 十 c 迄 aa 则 
NS 一 人 人 


p 六 (aa 十 c) >pb(a)( 因 上 E (ao ai 十 c))) 耕 aa<a <a 十 c 则 a 二 <a” 十 
c, 于 是 pa 十 c) > 六 (a  ) > pa) 总 之 , 当 a<a 时 %(a)>0. 同 理 知 a > 
a* 时 风 (a) 一 0. 故 a* 是 ga) 的 最 大 值 点 , 即 8a) 妥 ga )( 一 切 ac). 设 a， 
满足 (3. 3). 我们 指出 上 必 有 8 一 a 过 久 一 4 .用 反 证 法 , 设 2 一 < 所 和 一 

0 f<fec 。 RN 加 四 
一 C 则 | Zz)dz< | 户 (Zz)dz 一 Ya) 入 Pa ) 一 7 过 与 Ga 类 正 (3.3) 但 
丰 盾 . 故 0 一 aa 之 六 一 4 . 

最 后 证 明 : 对 任何 满足 (3. 3) 的 ayp, 若 0 一 4 之 入 一 QI(Calypl 也 满足 


六 ac， 
(3. 3) ), 则 ai; 一 ca ) 记 一 六 .实际 上 , 令 a 一 记 一 al ga) 一 | 力 (z)dz, 则 gai ) 


3 网 ga) 在 ai 达到 最 大 值 ， 


pz)dz 一 内 ac). 可 


故 见 (ai ) -一 0. 即 有 
p 记 (al 十 cl) 一 六 (al) 一 0. 
这 表明 训 (b  ) 一 训 (al )， 由 于 方程 组 (3. 3) 一 (3. 4) 的 解 是 唯一 的 . 故 al 一 Ca ”， 
e 4D 。 


Di; 一 0 。 


FF 


人 、YTII 、 开 

二 RhidL 二 ， 

(二 ) 正 态 分 布 . 

站 及 万 hh 了 YY 上 上 一 六 有 太一 AAAa 了 

设 X~ NGC,o).， 问 :如 何 从 样本 Xi ，…,X,。 找 出 未 知 参 数 / 
的 置信 区 间 和 co 的 置信 区 间 ”? 


一 他 nm 


这 里 可 细 分 为 三 个 问题 : 

(1) 已 知 c, 找 A 的 置信 区 间 ; 

(2) 未 知 w, 找 的 置信 区 间 :; 

(3) 未 知 c, 找 w 的 置信 区 间 . 

我 们 可 分 别 找 出 相应 的 枢 轴 量 . 对 于 (1) ,自然 想到 用 样本 均 


值 双 估计 /可 以 证 明 As 一 (一 力 服从 N(0,1)( 见 下 面 的 定理 





3.3), 从 而 疡 是 枢 轴 量 . 对 于 (2) ,自然 想到 用 3 一 
马 )* 估计 坟 , 可 以 证 明 ?= (一 D)S, 志 服从 n 一 1 个 自由 度 的 X 分 
布 ( 见 下 面 的 定理 3. 3) ,从 而 7 是 枢 轴 量 . 对 于 (3), 可 以 证 明 


了 加 (有 一 由 
5 


二 全 ee CE 二 二 也 


的 分 布 导 wya 无 关 ( 见 下 面 的 定理 3.3), 从 而 工 是 枢 轴 量 . 


为 了 了 证明 上 机 抽 由 的 且 个 结论 TENHHB 门 条 在 统 计 光 中 应 用 
改天 MLMIBHRJOLDT 有 陛 ? 上 是 力 信守 人 尾 蕊 和子 本 放 / 响 


广泛 的 基本 定理 ， 先 从 好 分 布 的 直观 意义 谈 起 
定理 3.1 设 X,…,X, 相互 独立 同 分 布 , 共同 分 布 是 
NC0,1D , 则 鳃 X3 服从 个 自由 度 的 X 分 布 (密度 函数 见 
(3. 2))， 
证 明 ,这 是 初等 概率 论 里 已 经 证 明 过 的 结论 ,证 明 方 法 是 计 
算 上 的 分 布 函数 ,然后 就 可 看 出 上 的 密度 函数 正好 是 (3.2)， 这 里 
从 略 (参看 [1])， 
@ 40 @ 


系 3.1 若 针 服从 ”个 自由 度 的 X 分 布 , 则 有 一 

这 从 定理 3. 1 直接 推出 . 

按照 习惯 的 记 法 ,如 果 上 服从 ”个 自由 度 的 X 分 布 , 则 记 
为 EX (7 )， 

对 于 X 分 布 的 变量 ,有 下 列 重 要 性 质 . 

系 3.2 设 上 与 7 相互 独立 ,EX (7) ,7 一 X 《77 ) , 则 


e 十 7 一 X (2 十 mr) 


证 明 :这 利用 定理 3. 1 甚 易 推 出 , 留 给 读者 自己 完成 . 
定理 3.。 2 食 入 1 , 入: )…。， 人 入， 相互 独立 , 且 


Xi; ~ NO yyG (z 一 1,2，……，71) 


全 


郊 = youX， (z 一 1,2，…。，,77) 
则 半 ，… ，， 相互 独立 , 且 


一 NU > airas ,02 ) (一 1,2，…)71) 
& 一 ] 


证 明 : 先 考 虑 特殊 情形 :m 反 0( 三 1,2,，…，,7)， 此 时 和 ，…， 
X, 的 联合 密度 是 





LTG 2 
任 给 定 二 上 .人 公 
一 -下 人 Le 和 上 和 人 7 性 
门 一 人/ (> NT 2 ,< -1 927 。 2 
羡 L (下 一 1 yw 省 mL 二 了 之 9 


ee LA 。 





下 (和 雪 太 过 纪 ) 一 枚 并 -一 ) eep 仁 记忆 也 jdz 
】 


(这 里 dz 一 dz 
作 变 数 蔡 换 


则 
一 yo (z 一 1 27) 
变数 替换 的 雅 可 比 式 为 
1 /| 1 着 一 
Jr 一 14 | 王 1 或 一 1 














了 19 
义 
sn 2 < 2 
2 Ri 一 之 /2 
1 1 
故 有 
已 和 委 YY 委 帮 ) 
Pi rr / 1] Na 人 ] 一 :| ] ] 
一 | 证 exp 3 之 | 放 ，…dy， 
1 
-一 二 LJ-- vv 了 v | T2 | | 
-六 ~- Li 一己 ri 。，。 人 和 ， 上 
人 在 此 式 中 当 了 7 去 1 时，, 令 误 一 co 得 
Py 去 切 = 六 exp( 一 业 1d 
i 7 一 CXDPDY 三 7 ; 
人 | ZTr p 222 | 
从 而 
PC 委 三 YY 委 加 ) 一 下 PC 科 巧 
1 一 1 
这 表明 Y ,…，,Y, 相互 独立 且 服 从 同一 分 布 N(0,o). 


现在 考虑 一 般 情 形 . 令 2 一 X: 一 上 pi，* 则 Zi ,…，2, 相互 独立 ， 
都 服从 N(0,o ). 根据 刚才 已 证 明 的 特殊 情形 , 知 aas2， 


>，awu2Zx 相互 独立 , 且 


。* 
是 上 


由 于 
YY 一 -一 2ozs 二 补 oow (i; 一 ,2，…，71) 
故 了 ,….,Y 相互 独立 , 且 


M 


定理 3.3 设 Xi，…,X, 相互 独立 ,都 服从 NGC) , 则 
(1) 束 一 二 忆 X ~ N(m， 乞 ) 


(2) 二 > CX 一 一 束 ): 一 X (2 一 1) 





万 
Jo 一 FA io Ah 站 -人 
人 全 日 L 人 证 局 下 人 月 日。 全 
了 ， 一 CQ (7 一] 2 ) 
类 一 1】 

从 定理 3. 2 知 ,Y， Y 相互 独立 ,上 且 Y 一 NCvnrw yo ),Y ~ 

AAA 人 Lv 7 可 有 矶 和 和 一 一 -~ 7 忆 人 WA 本 2 
NO )(z 一 和， “7 力 ) . 于 和 是 


e。 49 。 


由 于 


灵 | 
SN V 本 知 囊 记 、\ 2 _ SN 忆 六 2 7 书记 2 
] 1 
多 训 


利用 定理 3. 1 知 


服从 ”一 1 个 自由 度 的 X 分 布 . 由 于 媚 ，…，*Y, 相互 独立 , 故 束 与 


> (X; 一 误 ): 相互 独立 . 
休 ?t 人 
顺便 说 一 句 ,定理 3. 3 的 (3) 是 正 态 分 布 极 次 刻 的 性 质 . 经 过 


JI TH LAN PR 1 人 TITRso 挛 m 这 -AAA -一 上 -二 人 人 HL FE T 上、 M - 计 
了 刀 泥 代 的 你 人 全 究 庆 赴 ,只 有 正 态 分 布 才 有 这 - | 十/ 顺 。 了 汰 站 有 已 ， 石 


一 个 总 体 的 样本 均值 X 与 样本 离 差 Y， (X， 一 六) 相互 独立 , 则 这 
个 总 体 必 服从 正 态 分 布 . 


一 一 人 人 
月 」】 和 下 姓 Do5D] 拭 人 肛 j 可 以 找 出 正 态 分 布 参数 [LI 的 置 置信 区 | 


设 入 1 9 入， 是 来 目 No ) 的 样本 ,从 定理 3. 3(1) 知 


一 从 ( 台 一 A ~ NCO,1) 





于 是 ，,c 已 知 时 区 间 
e。 DO 。 


| 往 一 1.96 -二 ,又 +1:96 -| (3.5) 
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是 “的 置信 水 平 为 0. 95 的 置信 区 间 . 具体 说 来 ,如 果 做 100 次 抽 
样 (每 次 抽 z= 个 单元 ) , 则 算出 的 尺 值 大 约 有 95 次 使 得 区 间 (3. 5) 
包含 4 当然, 也 可 能 磁 到 这 个 区 间 不 包含 的 情形 ,但 出 现 这 条 


情形 的 可 能 性 比较 小 , 约 为 5%%. 
我 们 还 要 注意 ,置信 区 间 的 长 度 与 样本 量 有关. 当然 希望 
填 信 区 间 的 长 度 越 小 越 好 ,但 为 此 需 付 出 代价 :” 必须 大 . 故 在 实 
际 问题 里 要 具体 分 析 ,适当 掌握 ,不 能 走 极端 . 
例 3.1 某 车 间 生 产 滚 珠 , 从 长 期 实践 中 知道 ,滚珠 直径 X 可 


让 一 二 全 全 下 一 全 


以 认为 是 服从 正 态 分 布 的 .从 某 天 的 产品 里 随机 抽取 6 个, 测 得 
直径 如 下 (单位 : In ) ， 


一 一 


14. 70，15.21,14.90，14.91，15.32，15. 32 


证 体 计 该 天 普 吕 的 直径 的 平均 值 ? 如 果 知 道 该 天 产品 直径 的 方差 
三 H 丰 AN 起 愉 人 要 且 人 忆 RJAO 丰 


是 0.05 , 试 找 出 直径 平均 值 的 置信 区 间 ( 置 信 水 平 为 0.9572? 
易 知 ,这 6 个 数 的 平均 值 =15. 06(mmy) , 这 就 是 直径 平均 
值 w 的 估计 值 . 利用 (3.5) 知 wx 的 置信 区 间 是 L14. 88,15. 24」( 置 
信 水 平 为 0. 95). 
如 果 呈 未 知 ,需要 找 号 的 置信 区 间 , 从 定理 3. 3 知 


办 二 去 CX 一 一 到) 一 X (2 一 1) 


查 书 末 附 表 3, 有 An: 使 得 


1DVY33 一 WU、 人 一 -和 人 个 OK 
NALN 人 YY 全 AI27 一 V。vD 
于 是 
P( 工 COX 一 丽 ):<o 二》 (CX, 一 又) 1] 一 0.95 
Was 人 一 1 本 全 ) 
这 表明 c 的 置信 水 平 为 0. 95 的 置信 区 间 是 
[二 COX 一双) 二 OK 一双)2 (3.6) 
LA2 休 AI1 J 


可 类 似 地 找 出 e 的 置信 水 平 为 7 的 置信 区 间 ， 


更 在 问 ， 如 采 ce 未知 ， 如 何 找 z 的 置信 区 间 ? 





_Vz( 和 一 A) 
的 分 布 是 完全 确定 的 ,与 woc 无关. 显然 ,如 果 人 的 分 布 函数 能 求 
LI NSTR 1 (二 了 有 
LU 和 9 六 JJ JJ 人 到 [LT 二 
P(| TI 和 ))=7 (0<y><1) (3. 9) 
上 
J 人 下 
/ 王 | 9 ee 一 所 从 9 \ 
P 忆 < 一 “说 SS “后 呈 7 
这 表明 ,的 置信 水 平 为 } 的 置信 区 间 是 ， 
矿 _ ( _ |] 
| X 一 人 一 ,入 十 和 一 |. (3. 10) 
L A/71 A/72 
:5 分 布 申 曙 数 是 什么 呢 ? 下 服从 所 谓 2” 一 1 个 自由 度 的 i 分 


布 . 分 布 的 定义 是 这 样 的 ， 
定义 3.3 ” 称 随机 变量 5 服从 ”个 自由 度 的 + 分 布 ( 简 记 为 
5 一 :omD)), 若 《的 分 布 密度 是 





力 () 一 (1 二 亏 ) (3. 11) 
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ss 
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ee。 DO2 。 


“分布 的 直观 意义 与 重要 性 在 于 下 列 事实 . 
定理 3.4 设 与 7 相互 独立 ,上 -NO0,1) ,7 一 X (0* 则 


民 从 双 个 自由 庆 的 上 分布 
民明 由 充 HL 刀 人 和 ， 


证 明 :这 个 定理 在 初等 概率 论 里 已 证 明 过 . 证 明 方 法 是 计算 2 
的 分 布 函 数 ,然后 知道 5 的 分 布 密度 正好 是 (3.11), 这 里 从 略 ( 人 参 
看 [1j). 从 (3.7),(3. 8) 及 定理 3. 4 知 随机 变量 下 服从 # 一 1 个 自 
由 度 的 上 分 布 . 

上 分布 的 密度 图 数 是 z 的 偶 函 数 . 当 目 由 度 "之 25 时 上 分 布 
的 密度 曲线 与 标准 正太 分 布 的 窗 度 外线 极为 续 近 ， 可 以 证 明 
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0 
站 人 证 明 是 不 
工 \ 加 


难 的 ， 请 读者 站 已 完成 (提示 | 用 斯 特 林 公式 ). 


ea- ee 


上 分布 的 分 位 数 表 已 造 好 , 见 书 末 附 表 2. 
据 上 所 述 , 若 Xi ,…,X, 是 来 自 N(Cu;o2) 的 样本 ,对 给 定 的 置 


虽 了 一 一 /AL 7 “一 “放下 mA 〈“" 吕 一 作 Lr 上 -~ 


信 水 平 7, 查 : 分 布 表 可 找到 ) 满足 \3. 9) ,从 而 得 到 A 的 置信 区 间 
《3. 10)， 
例 3.2 用 某 仪 项 间接 测量 温度 ,重复 测量 5 次 ,得 (单位 :CC): 


1 尹 C 人 人 DA 1 224C DRAAN 1T DT7TC 
上 CUV 9 1 2695， J 一 士 J 9? 1 2060， 了 忆 f 


问 :温度 的 真 值 在 什么 范围 ? 


< 人 一人 ae YA 人、 让 昌 m T < 二- -vt 间 上 上 


我 们 很 容 多 把 这 个 问题 化 成 数学 问题 . 用 w 表示 温度 的 真 
值 ,X 表示 测量 值 . X 通常 服从 正 态 分 布 , EX 三 Ap( 假 定 仪器 无 系 


本 


统 偶 差 )， 上 述 5 个 数据 可 看 成 是 来 自 X 的 样本 . 问题 是 找 出 zw 
的 置信 区 间 (方差 未 知 ). 


了 ”WE 


利用 上 面 的 理论 ,w 的 置信 区 间 是 (3. 10)， 现 在 一 5,X 一 1 259， 
S 一 一 二 2 (CX 一 X): 一 > 全 .为 了 找 , 查 附 表 2( 注 意 自由 度 


11 一 一 


这 里 oCz) 一 





e。 D3 了 3 。 


一 1 一 4) ,对 于 y= 一 0. 95 王 1 一 0.05, 查 得 1 一 2.776, 于 是 wx 的 置 


区 间 是 [1 244. 2,1 273. 8j (置信 水 平 为 0. 95). 
以 上 对 指数 分 布 和 正 态 分 布 的 参数 讨论 了 如 何 利用 酌 轴 量 方 


站 
人 一 -人 JJ JANEJUL LA AL PR AT JJ IT 一 THH 二 忆 /v 


法 寻找 置信 区 间 . 对 许多 其 他 比较 简单 的 分 布 , 也 可 类 似 地 得 到 


会 数 的 团 信 区 间 》 田 不 人 6 了 了 
三 /一 DJ。 


枢 轴 量 方法 有 两 个 明显 的 缺点 :@D 怎样 寻找 枢 轴 量 ? 没有 统 
一 的 方法 ;@ 利用 枢 轴 量 方法 得 到 的 置信 区 间 有 何 优良 性 质 ? 没 
有 明确 的 结论 . 

现在 介绍 寻求 置信 区 间 的 第 二 个 方法 一 -统计 量 方法 设 
X, ,…,，,X, 是 来 自分 布 函数 为 F(r,b)(bE @) 的 总 体 的 样本 ,@ 是 
任意 非 空 集合 ,g(b) 是 9 上 的 实 值 函 数 . 设 p(X ,…, Xi ) 是 任何 


广义 性 估 夭 计 县 人 
入 -大 上 电 世 L/ 时 一 


G(c,0) 一 PCp(CX 和 X,) 之 c) (3. 12) 
9) 一 Pi(Co(X，…,X)>c)， (一 cc 
与 参数 0 相应 的 概率 . 易 知 C(c,0) 是 c 的 左 连续 减 果 
数 . 只 定 0<7y<1, 令 

gj (c) 一 inffg(0);0EB 且 G(c,0) 全 1 一 ”)》 @ (3. 14) 
gu(c) 王 SuptEg(O) :0E@ 且 (c0)<7) (3. 15 ) 

我 们 有 下 列 重 要 结论 : 

定理 3.$ (1) gr(Co(CX，…,X,)) 是 g5(0) 的 置信 水 平 为 7 的 
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PoCgC0 委 grCP(A1，…XD))) 之 7 《COG ) (3. 17) 
(3 ) 设 8 一 min(S8L CO(XI，…， ， 入，) ) ， ”0DU (PCA1， …，A，)))， 


中 当 不 存在 2 满足 G(c,0) 盖 1 一 > 时，, 令 gL(c) 一 sup{&(0) 0E); 当 不 存在 0 满 
足 互 (c,0)<7y 时 , 令 guy(Cc) 一 inf(g(0) :06E 9) 


。 54 。 


BE 一 max(CSLICOCCA ，…， 从 ， )) DCP( 和 1 ， 入， ) ) ) ， 则 上 eg; ] 是 
8 人 的 置信 对 27 一 1 的 置信 区 间 ( 当 0.5<7y<L1L 时 ). 


显然 可 人 L ZLZ 士 YA 人 ATANV VON 十 过 抽 UL 下 面 证 证 结论 《1 ) 


柑 | 


J LA-DmyrC\L 上 7 THN、\ 人 二 JJ 上 LUH。 蔬 
成 立 
Fr 门 一 人 隔日 有 
HI ACT 个 HL 有 亡 
Pi(g(0)<grCo(CX myX,)))<1 一 7 (3. 18) 


为 简单 计 , 记 QZ 一 p(X，…X)， 则 CGO0) 一 PCZ 过 xz) 是 2 
c0 一 inftc: 一 ce 委 cC 委 coCGc 0) 委 1 一 7) 
分 两 种 情形 进行 讨论 . 
中 GCCc 0 委 1 一 7 
此 时 Prp() < (2 过 PCGCZ， 


4 人 JJ 0\ 姜 ~ 已 革 NA ~ 人 人 0 


C(co 0 委 1 一 包 故 (3. 18) 成 立 . 
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此 时 PCg(O<grCZ)) 委 PCGCZ0) 委 1 一 2) 一 PCZ >co) 


志 
=- 一 人 . 

AAA 一 了 HH 人才 开 2 -过 全 -~ rn 4 一 个 ~ HHr nm 

态 二 1 人 上 有 月/ 岂 生 和， 下 1 0 一 一 ” 山 LUHJ 4 三 0; (ID co 一 ~ 一 9 儿 LDJ 
A 一 limP,(Z 之 一 中 一 limG( 一 六 1 一 o; (11) 一 co<co<co ,此 
是 A 一 1; 一 P 1 了 AN- 一 1 、 人 A-< 一 1 
j 全 1 人 4 二 | 7 0 7 Co | 刀 人 h。 逮 二 人 一 
一 ”, 故 (3. 18) 成 立 . 从 (3. 18) 直接 推 知 (3. 16) 成 立 . 用 同样 的 方 
法 可 证 (3. 17) 成 立 ， 定理 3. 5 证 举 

从 一 个 统计 量 gp 一 p(CXi，…，,X,) 出 发 ,利用 定理 3.5 得 到 
z(g) 的 置信 下 (上 ) 限 及 置信 区 间 的 方法 叫做 统计 量 刀 法 . 实际 应 
用 此 方法 时 ,通常 取 g&(0) 的 一 个 佑 计量 或 估计 量 的 一 个 增 果 数 作 


为 统计 量 o(X ,…,X ) ;而且 要 使 得 G(c,9) 和 吾 (c,g) ,ge (c) 


AVAYri 王 于、< 人 1 3》 ,AN) 人 县 多 1 语 、2\ ww7ATIm NU AL 9 的 名 


gu(c) 都 比较 好 计算 , 才 便 于 获得 具体 的 置信 限 或 置信 区 间 . 这 些 
都 需要 具体 问题 具体 分 析 . 
例 3.3 设 X 服 从 伯 努 利 分 布 , 即 
e。 DD 。 


PCX 一 ID 一 p 一 1 一 PC(X 一 0)， 
数 ,0 委 2 和 1. 问 : 如 何 从 的 样本 XXX。 找 


多 知 ， 轧 的 抢 估 计 记 一 > X,/7z， 取 统 计量 OAI1，…， 人 入，) 一 


SS 
T 
祥 
> 
>4 
VV 


当 有 & 王 0,1,， 7 时 G(R， 户 ) PS 5 Seoa_ar 
多 次 使 用 分 部 积分 公式 得 加 


、 f 有 
G(E, 力 ) 一 一 ET|.z 二 (1 一 zedzr (R 之 1) 


(&R 一 1)1(67 一 
由 此 可 见 ,1 乓 上 2 时 G(G&,b) 是 关 的 严格 增 连 续 函 数 , 设 访 (4) 古 
方程 CCR,D) 王 1 一 7 的 唯一 根 , 则 有 & 郑 1 时 从 (3. 14) 知 
力 (RD) 一 inftt 力 :0 委 轨 1),CGCRbD) 盖 1 一 7) 
-和 -入 (PN 


P\ 八 7/ 


万 一 方面 ,C(0, 六 ) 二 1, 从 (3.14) 知 加 (0) 一 0. 记 思 (0) 一 0 则 祖 的 
X: 水 平 置信 下 限 为 如 (>/X). 易 知 G(1,) 一 1 一 (1 一 万 )"， 
GGn, 因 ) 一 加 , 故 加 1) 一 1 一 因为 0) 一 (1 一 )*. 当 1<&<z 时 
训 (A) 无 显 式 表达 ,下 一 章 将 给 出 计算 公式 . 

我 们 特别 指出 ,pz) 一 (1 一 7 


式 . 例如 ,为 了 估计 某 种 炮弹 的 发 射 成 功率 六 ,进行 了 20 这 输 。 
编 果 每 次 都 成 功 , 则 了 祖 的 0.80 水平 置 信 下 一 (0. 2)5 一 


0. 922 7. (1 一 ”)z 乃 是 无 失效 情形 下 成 功率 的 y 人 
自然 要 问 :是 否 有 OCX ，，…，,X,) 满 足 


忆 ,( 力 这 人 AI 人)) 三 7 (一 切 力 人 (0，1)) (3. 19 ) 

答案 是 ,这 样 的 V(Xi，…,X,) 不 存在 . 用 反 证 法 . 假设 有 这 

样 的 少 记 < 王 YL1,…，1)( 目 变量 全 是 1)， 分 两 种 情况 讨论 . 
e。 DO 。 


@ “一 1, 此 时 当 peE (a,1) 时 y 二 P,(p> 内 Xp,X)) 之 Pb 之 
狼人， 从) 入 一 一 入 ， 一 上 ) 一 卫 ， (和 一 … 一 一] ) 一 力 "， 今 


>] 让 vv 全 1 予 因 1 (人 -全 1 由 时 对 AC(O 1 右 1 一 一 
局 /一 1 放 间 NM CC 一 上 ULUHRJ AW 世 忆 \ vv9L/ 二 / 一 
户 ( 力 < 多 AI AD)) 之 也 (人 访 < X)，AX 一 … 一 人 一) 一 


国 从 ， 4 xXE 3 3 YA 工 了 了 二 一 7/ 


轨 . 令 b 一 1 得 1 一 7 之 1. 这 又 与 yE(00,1) 相 下 丰 ， 总 之 ,不 可 能 有 
(XI ，…X,) 满 足 (3. 17 ). 


X < 去 户 (X ;和 ) 满 足 


女 且 上 于 和,) 舌 下 


。 刀 , (页 (XI AN) 加))= 王 7 
但 是 ,可 以 证 明 


infP,( 之 pb >》 X)) 一 7 (3. 20 ) 
PP ”全 
六 四 pp 的 定义 及 间 . 辐 pr0 一 0.8 人 1 时 .8 且 六 程 (8 一 
ce 一 一 Yv 一 上 归 7 了 人 人 -AT7 


我 们 可 证 明 下 列 一 般 性 结论 ; 
二 定理 3.6 设 G(c,0) 和 gc) 分 别 由 (3.12) 和 (3.14) 给 出 . 若 对 任何 
e 盖 0, 存 在 样本 值 (z ，…,z) 及 0"EG@ 满 足下 列 条 件 : 
(1) gr(o(z 和 yz)) 二 g(9" ) 


(2) G(o(zo ,zy ) 之 1 一 y 一 e 
Z 二 8 已 


Ne 人 ww 有 AAA ULA 


(3) 有 一 列 久 , 凡 ,… 使 得 g(7<g(9 ) 且 limGCp( 双 ，… 冯 )，0) 一 


CCPCz Zn)0”)， 则 
in 甩 4 (gb)>8r(8CX …X,))) 一 7 (3. 21 ) 
证 明 ; 记 Zoo0X 和) 四 一 payaa) 从 (3.16) 知 ， 
7Sin 了 SO 人 Sr2))SPa (CgE() 之 BITCZD)) 

去 Pl (g(b ) 之 gr(2))》 一 PE (gr(a) 之 EXZ)) 

-1 一 P， (8 (2 之 有 (< 扩 1 一 P， (Za) 一 1 一 G(z yp) 
令 Aco 得 

Js 福 in 下 oo(C8( 的 一 8L(20) 安 1 CCzo 0”)<7YT 十 e 


e DA 。 


再 令 ~>0 知 (3. 21) 成 立 . 证 毕 . 
对 于 置信 上 限 gu(Ce(CX ，…X)) 有 类 似 的 定理 ,从 
从 定理 3.6 容易 推 知 (3. 20) 成 立 . ( 取 刀 王 … 王 妈 三 1,g8(0) 一 0,0 一 轧 ， 


外 一 一 (1 一 力 和 一 负 一 让 (1 一 于) 一 1,2，…， 即 知 )， 


从 定理 3. 5 和 定理 3. 6 的 证 明 过 程 知道 ,我 们 并 没有 利用 X ,…,X, 是 


他 AD hr 上 HH 4 -一 99 上 关 生 六 一 ESE 十 六 HI 2 AAA -站 士 色 到 
人 的 性质 ,只 要 (Xi 9 ,X,) 是 随机 回 量 ,其 概率 分 布 恢 顿 于 参 


数 0 即 可 . 因而 统计 量 方法 应 用 极 广 . 既然 从 硅 何 一 个 统计 量 woCXI ，…， 生 。) 


那儿 四 隶 人 和] 这 如 和 县 色 ] 的 6 王仁 


LI 心 . 冰 DT 人 诅 人 | rrONEA 咀 人 过 -~ 民 
三 风 | 全 三 


LU LHRHPR 十 工 」 记 、 UV7 RNJ 


限 有 何 优 良性 ? 
为 了 表述 优良 性 , 先 下 一 定义 . 
定义 3. 4 设 pCzi，… “Zn ) 和 ZI .2zn) 是 两 个 函数 , 称 沙 对 pp 是 保 
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之 的 若 对 任何 ( ~ oo。 ~ KU ~》 口 杰 (> 。 mm < 一 (一 
JJ HH- 9 LA AAAJ 1T_L LO 9 9 人 ITHNANL 1 9 9 PLAN 学、 到 1 ?mL ~ 人 人 人 人 13? 9 
Za) 就 一 定 成 立 Wz，…zo) 委 0Wzl，…zo). 


我 们 可 以 证 明 下 列 


叶 


定理 3.7 设 p(X ,，…'X,) 是 任何 统计 量 ,g(0O) 是 0 的 函数 ,grCpCX ，…， 
X,)) 和 gu(Co(X ，…，X.)) 分 别 由 (3.14) 和 (3. 15) 确 定 ， 内 (Xi ，…，,X。) 和 
崭 (X Xu) 分 别 是 g(0) 的 > 水平 置 信 下 限 和 置信 上 限 且 二 者 都 对 wp 是 保 
序 的 , 则 
页 (XXXD)<grCP(X XXX。)) 
内 (XI X) 志 gu(Cp(CXI ，…，X，)) 
换 句 话说 ,由 统计 量 p 导出 的 置信 下 限 gr(op) 是 所 有 对 9 保 序 的 置信 下 限 中 
最 大 的 ,由 ?导出 的 置信 上 限 guv(Cp) 是 所 有 对 9p 保 序 的 置信 上 限 中 最 小 的 . 
注意 ,对 给 定 的 置信 水 平 而 言 ,上 限 越 小 越 好 ,下 限 越 大 越 好 . ) 
我 们 不 令 述 定理 3.7 的 证 明了 ,读者 如 有 兴趣 ,可 参看 [16j 的 第 六 章 . 
顺便 说 一 句 ,统计 量 方法 有 一 个 等 价 形式 一 样本 空间 排序 法 ,后 者 有 


”明了 AAA 


时 更 便于 应 用 ( 见 L16j] 的 第 六 章 )， 
作为 本 节 的 结尾 ,我们 指出 下 列 两 点 : 


IT i -一 Li NT 亡 二 有 JW 。 


(1) 我 们 未 对 置信 区 间 的 优良 性 进行 深入 讨论 ,迄今 尚 缺乏 
统一 的 令 人 满意 的 理论 . 对 一 些 特 殊 情 形 是 有 严密 的 数学 理论 
的 ,参看 文献 L2j,L12]. 当然 ,我 们 应 该 找 宽度 尽 可 能 小 的 置信 

。 59 。 





间 呢 ? 可 以 证 明 ， ,对 于 N(po ) ,只 要 未知 ,不 管 样本 


1 
-大 不 在 在 周 宅 和 守 谨 的 置信 区 间 . 但 可 采用 两 阶段 方法 ( 样 
人 ?情人 作 人 存在 固定 铭 度 的 置 人 | 百 一 - 河 交 区 /人 


是 随机 变量 得 到 固定 宽度 的 置信 区 间 ,具体 理 由 见 第 六 章 


8$4 分 布 函数 与 密度 函数 的 估计 


分 布 范 数 的 估计 设 X 的 分 布 吨 数 下 (z) 未 知 , 如 何 从 样本 
…,X， 估计 下 (z) 的 值 (z 给 定 )? 这 是 很 重要 的 问题 . 掌握 随 


灾 最 的 入 性 斌 月 亚 严 滞 它 的 人 分布 当 甸 许多 重要 的 定 呈 门 ] 芭 本 
机 杰 量 的 特性 加 是 归 弄 清 它 的 分 布 师 数 , 才 多 十 要 的 实际 问题 要 


求 估计 FF(Gz). 例如 在 产品 或 生物 体 的 寿命 分 析 中 ,人 们 和 篆 关心 
寿命 X 大 于 了 的 概率 SCz) ,显然 SCz) 王 1 一 FFGz). SGCz) 叫 做 可 
如 果 FGz) 的 图 数 类 型 已 知 , 只 是 含有 未 知 的 参数 , 则 常用 前 
几 节 的 办 法 舍 计 未 知 参数 ,从 而 弄 清 下 (z) 是 什么 . 知 不 知道 
FCz) 的 分 布 类 型 ,怎么 办 ? 只 好 用 非 参 数 方法 . 
给 定 工 后 , 记 凤 为 XXX。 中 不 超过 二 的 个 数 ,是 然 用 频 
率 F,(z)- 一 二 v。 去 估计 概率 F(z) 一 PCX<z). 


定义 4.1 称 z 的 函数 F,(z) 为 X 的 经 验 分 布 函 数 ， 
广 在 


T Lv 9 


入 1， 
可 


( 并 ) 


。 


1] < - rr 、 
人 (一 co, 如 人 全 ii/ 


这 里 14 表示 A 的 示 性 盟 数 . 根据 踢 大 数 律 知 
。 509 。 


PClimnFGz) 一 和 (zz)) 一 1 (一 切 并 ) 
这 是 经 验 分 布 函数 通 近 理论 分 布 函数 的 理论 根据 开 ,(z) 的 表达 


式 可 以 写 得 更 清楚 些 . 将 Xi,…，,X, 按 值 从 小 到 大 排列 ,得 到 
XD<X 委 … 秋 Xu, 其 中 入 0 叫做 第 2 个 次 序 统 计量 (一 1， 


2,…，,72)， 易 知 





f 八 -一 有 
?9 必 ~、 人 (1) 
了 AAA R mm 和 且 万 甩 万 NA 人 
上 AT 二 4， 人 所 LA ACEH) AR 一 上， L 7 一 了 ) 
1 袜 之 义 (m 
我 们 有 下 列 更 强 的 绪论 : 
定理 4.1(CGlivenko - Canteli : 设 
门 一 Sup| 下 (zy 一 下 (7z) | 
所 有 上 | 和 只 \ 必 7/ <、 以 / | 
则 
PClimDD， -一 0 ) 一 


证 明 : 设 > 是 任 一 正 整 数 ,& 王 1,2,……,y， 今 
d 
z ,= or > (inf gf 二 -) 


设 zE [Lzeyzrer) 则 


TS AN < 直 ) 


T Y 


7, 寻 1 一 0) 


< 了， 
Fa Fa < FCz en 一 0) 





于 是 
FCzi 一 Fr 一 0) 入 FiCz) 一 FECz) 
二 F(CzyHl 一 0) 一 下 (zye) 
由 于 
FCz 一 0)< 盖 <F(z ) 二 Fr 一 0) 
< < 二 FCz， kt+1 ) 
故 
0 入 Fr 一 0) 一 FCz 去 了 
从 而 


ee 00 。 


下 ( 工 ) FCz)< 雪 下 Czytl 一 0 ) 一 下 《 工 y, 导 1 一 0) 十 了 


了 (ZJ) 一 了 (人 Z) 之 丰 s(CZy) 一 上 (Zrk) 一 一 
于 是 


十 了 (ZeD) 一 下 (Zy) 十 过 


其 中 工人 [L zy yy, 二 1 ) (R 一 1，2，…， 7 一 ])， 
当 z<xzy 时， 


F,(z) 一 FCzD)sF(zm 一 D< 委 |FCzri 一 0) 一 FCz 一 0)1 十 二 ， 


| 一 


F(Z) 一 下 (CTZ) 委 FFGz 一 0) 委 一 ， 


交 关 


An 


| 一 


| 民 Cz) 一 (zxz) | 一 FGOz) 一 下 (zz) 扫 FCz，，) 一 下 (yy ) 
一 | 民 (Czy) 一 Gzy)| 
(注意 ,我 们 规定 F(ce) 王 Eco) 王 1). 
总 之 有 


Y | 
sup| ECz) 一 FCz) | < 人 | ECz 一 0) 一 熙 (zs 一 0)| 


凿 一 ] 


依 是 
十 之 1FCzroD 一 FCzre) | 十 了 


AAA 
二 
A, 一 (lm (zy 一 0) 一 了 上 (zy 一 0) 
目 limF (zi 一 FOze)) (ER 一 1,2， 7) 
由 于 
下 。( 工 ) ) 一 工 》\T (一 ,可 《Xi) 下 (zz 一 0)= 工 NT (XI 
7 全 | 中 全 


从 强大 数 律 郑 


PCA;) 王 1 (7 过 1R 一 1， 7) 


令 A= 全 | 「 14, 易 知 PCA)=1. 但 是 


ACT1tinmnDD, 一 0} 


所 以 
PCiimDD 一 0) 一 1 
经 过 现代 的 深入 研究 ,还 可 以 证 明 : 对 任何 s 盖 0, 人 存在 常数 C 


(与 即 无 关 ) ,使 得 

忆 ( 及 全 ee) 挟 < Ce (7 之 ]) 
在 实际 工作 中 有 时 需要 估计 分 布 范 数 的 分 位 数 . 设 zx， 是 
和 


分 位 数 (0< 训 <1), 即 

PFCZzo) 之 力 字 了 (zy 一 0) 
( 即 P(X<z,) 三 思 >PCX<z，)) 
和 茶 X，…，Xw 是 样本 XI …,X, 的 次 序 统 计量 ,> 王 Lapj 十 1 我 
们 可 用 第 ~ 个 次 太 统 计量 Xo 作为 z 的 佑 计量 . 可 以 证 明 , 只 要 
方程 <FGz) 王 加 "至 多 一 个 根 ( 此 时 z 了 唯一) , 则 样本 量 无 跟 增 大 时 
Xc 怠 是 过 的 强 相 合 估计 : 


Li 4 上 扣 二 
已 J 三 
和 餐 肉 罐头 ,由 于 随机 性 ,每 个 匀 头 的 净重 都 有 些 差别 . 现 从 生产 线 
AL ~ 大 下 as Le AP 一 人 N\ 
荆 随 饥 摘 也 LU 个 办 头 ， 作 其 人 者 里 ， 集 下 庆 奴 搞 牛 亿 :8) 
344 336 345 342 340 338 


344 343 344 343 
试 求 该 生产 线 上 生产 出 的 镀 头 的 净重 的 分 布 困 数 ,并 估计 其 中 
位 数 . 

解 ” 我 们 用 经 验 分 布 函数 Fio(Cz) 作 为 分 布 函数 的 估计 . 将 样 
本 值 从 小 到 大 排列 :336,338,340,342,343,343,344，344，344， 
345 ,于 是 可 得 经 验 分 布 晒 数 Fio(Cz) 如 下 : 

ee 02 。 


TZ<330 


336 入 Zz<338 


\ 人 和 


CD) 


一 上 一 ， 
度 己 | 己 | 一 


338 和 <<340 


\ 和 和 





340 和 <Z<342 





| 
> 


下 10 (Z) 


CD 
中 汪 


| 
-一 一 -人 一 


Se Se 





344 和 < 345 


上 
CC 





一 一 
上 ~ 一 
和 


Z 之 345 
这 就 是 分 布 函数 的 近似 值 ， 注意 放 = 亏 时,[pm] 十 1 一 6. 故 可 用 


zeo 作为 中 位 数 世 的 估计 ， 即 锥 头 净重 的 中 位 数 约 为 343 g. 

如 果 随 机 变量 X 有 密度 函数 户 (z), 则 应 研究 密度 函数 娟 (z) 
如 何 估计 . 因为 密度 函数 更 能 直观 地 刻画 出 概率 分 布 的 特性 (如 
对 称 性 .峰值 等 等 ) ,如 何 估计 的 问题 显得 很 重要 。 特别 是 多 维 随 
机 向 量 情形 ,分 布 函数 用 处 较 小 ,又 不 便于 处 理 , 估 计 密 度 函 数 意 
义 更 大 ,在 图 像 识别 及 多 元 判决 中 要 用 到 这 里 仅 讨 论 一 维 随 机 
变量 的 密度 估计 问题 . 估计 方法 有 很 多 种 ,这 里 首先 介绍 历史 悠 


入, 现在 仍 在 广泛 使 用 的 直方 图 法 ,然后 介绍 近 40 年 发 展 起 来 
的 核 估计 法 和 最 近邻 估计 法 . 下 面 考虑 的 随机 变量 均 是 连续 
型 的 . 

一) 直方 图 ; 
…,X, 是 来 自 密度 为 FCz) 的 总 体 的 样本 ,用 RR,(Ca,b) 


入 1 ， 
表示 诸 Xi, 中 落 在 区 间 (a, 纪 的 个 数 ， 显 然 积分 | A(z)dz 可 用 
求 


由 微分 学 中 值 定 理 知 存在 zuE (ab] 


vs TELw 一 一 /0 本 


使 得 


三 (zo ) 一 1 大 CCz)dz 
0 一 QJ。 


故 可 用 
jzo) 一 一 DJ (4 , D) 


作为 /xzo) 的 合计 值 . 如 条 jz) 在 (ab 上 连续 ,又 2 一 4 很 小 , 则 


AN mA ATILAa 7 
可 用 广 (zo) 作 为 Fz) 的 近似 人 (一 切 并 和 女 (Qa ， 站]). 


更 确切 地 叙述 如 下 : 设 { 上 :一 0， ] ， … ,7 是 7 十 | 个 数 : 
一 ce<< 为 二 二 所 …<< 如 <co. 通 稼 假定 寻 4 一 去 择 凡 0(0 一 0 1，， 
7 一 1)， 今 


生产 
本 


~ 了 
上 、 ， 
-一作 ,( 友 ,万 +1)， 当 工 生 (tj 一 0, 1 ,7 一 ] 
六 (z) 王 1 


， [ 当 z<cn 或 z>> 如 


(< 
全 
小 
帮 
ja 
ne 


用 六 (z) 作 为 f(z) 的 估计 这 就 是 直方 图 估计 法 
实际 使 用 时 ,将 样本 值 XI ，…，,X， 从 小 到 大 排列 ,得 人 ob 委 … 
区 目 


”及 _ ~ 诈 记 池 f ML 
~ 个 X， 取 : 公 为 比 . 入 (1) 略 小 的 数 ,2 为 比 Xow 赂 大 的 数 . 1 二 


(a ,bmm 等 分 .分 点 


- 蔬 





.人 一 C 
上 一 0 二 (一 0,1, 777) 
2 
了 kE- 人 澈 人 1， 1] -十 光 rr 雪 让 光 hh FF 人 ENT |] 站 忆 人 
芭 件 小 党 八 \L 1 < 二 名 妇 X 50 人 任 煞 机 上 TFI 了 LE 信息 ， 
Di /RD) 为 高 的 长 方形 (这 里 一 0 一 /mr) ， 这 一 列 矩形 


DA 去 区 | 
叫做 直方 图 . 注 意 


L- 
| 机 


第 ;个 长 方形 的 面积 二 兰 二 |”A(y)ay 
在 直方 图 法 中 mm 的 大 小 没有 硬性 规定 , 当 样 本 量 产 小 时 ,mm 
。 64 。 


也 应 小 些 夭 大 时 , 思 则 大 些 ( 比 如 ,2 一 100 时 闷 可 取 12). 包 
我 们 许 细 令 述 下 列 例子 ,读者 可 从 中 营 握 直方 图 法 . 


el 4 及 二 了 Th AN DER r 二 Ar Rh 7 B AR PEI > 失 
区 。 扣 某 炼 钢 ) 士 厂 」】 一 和 作 菇 COMVLIL 1， 由 于 各 种 偶然 因 系 


的 影响 ,各 炉 钢 的 含 Si 量 是 有 差异 的 ,因而 应 把 含 Si 量 X 看 成 一 


th- 上 一 TPR2 产 - 记 iT 富 ”片上 二 广 


个 随机 变量 ,现在 看 看 它 的 概率 密度 困 数 是 怎样 的 ? 
已 录 了 120 


为 了 确定 密度 函数 ,} 炉 正 常生 产 的 25Mn Si 钢 的 
含 S 量 的 数据 (百分数 ). 
0. 86 0. 83 0. 77 0. 81 0. 81 0. 80 
* 0. 79 0. 82 0. 82 0. 81 0. 81 0. 87 
0. 82 0. 78 0. 80 0. 81 0. 87 0、81 
0. 77 0. 78 0. 77 0. 78 0. 77 0. 77 
0. 77 0. 71 0. 95 0. 78 0. 81 0. 79 
0. 80 0. 77 0. 76 0. 82 0.80 ,0.82 
0. 84 0. 79 0. 90 0. 82 0. 79 0. 82 
0. 79 0. 86 0. 76 0. 78 0. 83 0. 75 
0. 82 0. 78 0. 73 0. 83 0. 81 0. 81 
0. 83 0. 89 0. 81 0. 86 0. 82 0. 82 
0.78 0. 84 0. 84 0. 84 0. 81 0. 81 
0. 74 0. 78 0. 78 0. 80 0. 74 0. 78 
0. 75 0. 79 0. 85 0. 75 0. 74 0.71 
0. 88 0. 82 0. 76 0. 85 0. 73 0. 78 
@O 有 人 建议 采用 下 列 公式 : 
1 一 1 十 3. 3 22jogio 7 
也 可 按 下 表 选 择 mm 
天 1 

<<D0 D 一 0 

50 一 100 0 一 10 

100 一 250 7 一 12 

290 10 一 20 


ee 6D 。 


0.81 0. 79 0. 77 0.78 0. 81] 0. 87 
0. 83 0. 0o5 0.04 0. 78 0. 7o9 0. 8< 
0. 80 0. 80 0. 77 0. 81] 0. 795 0. 83 
0. 90 0. 80 0. 895 0.81 0.717 0.78 
0. 82 0. 84 0. 85 0. 84 0. 82 0. 85 


oo 
由 > 
呈 
~ 避 
Oo 
(一 
e] 
Oo 


0. 84 0.82 0. 85 ). 84 
下 面 对 这 120 个 数据 进行 分 组 : 
(17 技 中 人 庆 作 的 最 小 值 尖 0 64 .明基 值 
NM AUHUI 书 用 有 到 /仆人 JJ 开 HEL 
阴 屎 一 0. 02. 
(3) 分 组 及 频数 如 下 : 


分 组 频数 2 
0.035 一 0. 65o 4 
0. 0oo 一 0. 0795 0 
0.075 一 0. 0695 0 
0. 090 一 0. 1719 l 
0. /5 一 0.7395 l 
0. /35 一 0.7955 8 
0. /oo 一 0. /779 1 3 
0.775 一 0.7995 23 
0. /195 一 0.815 2 人 4 
0.815 一 0. 835 2 
0.835 一 0. 855 ] 4 
0. 8bo 一 0. 875 6 
0.875 一 0. 895 l 
0. 895 一 0. 9195 l 
0.91o 一 0. 9395 | 0 
0. 935b 一 0. 9595 ] 


以 上 用 实例 介绍 了 如 何 分 组 ,下面 根 据 分 组 情况 及 其 频数 来 
作 直 方 图 . 记 广 三 ww/aG 一 0,1, 7 一 1)， 设 横 轴 王 表示 含 Si 
。 66 。 


量 , 这 里 4 一 思 三 0， 035 ,1 一 (0. 055 ，…… ,5 一 (0 935 ,1 一 0 一 0. 9D5 ， 
1+1 一 点 二 0.02. 在 区 间 上 5 2400o 委 上 和 15) 上 作 高 度 为 户 / 六 的 长 
方形 , 汶 16 个 并 立 的 长 方形 是 本 例 的 直方 图 注意 ,第 ; 1 个 长 方 








by 7LA 9 人 一 -~ 上 Je AL] AL AL JJHNHJ -LA 1 。 Js _A 
形 的 高 度 是 
大 ，。 1 .1 二 上 
“120 0.02 2.4 
二 了 工 


一 
时 


为 方便 起 见 , 取 纵 坐 标的 单位 是 
长 方形 的 高 度 正 好 是 个 单位 , 见 图 1. 


7 -和 则 直方 图 中 第 ;个 


图 1 
有 了 直方 图 ,可 以 看 出 X 的 密度 曙 数 曲线 大 体 是 图 中 曲线 的 
位 置 . 从 图 上 看 ,这 条 曲线 很 像 是 正 态 分 布 密度 的 曲线 . 怎样 根 
据 数 据 判 断 X 是 否 服从 正 态 分 布 呢 ? 解决 这 个 问题 的 办 法 是 有 
的 ,请 看 第 三 章 
直方 图 估计 的 理论 基础 是 什么 呢 ? 我 们 可 以 证 明 ,只 要 间 陋 
-办 AL | | 记 “人 了 [一 HU 人 一 于 AN /LA 。 Jo 下 JJ JJ SA 了 LA JJ 9? 只 要 | 团 隅 


六 足够 小 ,样本 量 充分 大 ， 则 sup | 六 (z) 一 FGz)| 可 任意 小 ,这 里 
广 (Cz) 由 (4.1) 确 定 . 为 了 确切 说 明 这 一 点 , 设 { 如 } 是 直线 上 的 点 


7 了 TI 击 和 信 人 了 忆 人 





Tt 一 7) 一 2 一 ， 4( 刀 ) __ A(1) 一 了 ”人 aa 细 
钊 < 友 ” < 办 < ,这 里 不 1 一 大 ”和 皇 几 之 0 一 切 整 效 R)， 今 
mw AN ] T Ar 《 姑 )》 《 交 ) N 只 7 好 》 《天 》 了 、 
了 了 并/ -一 人 人 大 9 ZTT1 /) ( 当 工 EC (大 9 ZeT1 | 7) 


7 ， 
这 里 


玫 ， 人 ， = Ion om 《入 ii) 





"上 十 1 
1 关 ] ， 
定理 4.2.. 设 (JJ 在 点 工 连续 且 JimA， 一 0， im 7 力 ， 一 co , 则 
对 任何 ss0 帮 
lpPrirrry ”rr 人 > 人 人 一 人 0 (4 21 
工 上 LN | .nnN\-L7 JJ 、\-L]/ | 一 一己 /7 从 工 。 密 
网 汪 
证 明 :因为 太 。 ) 在 点 工 连 续 , 故 有 G>0 及 天 ,>0, 使 对 一 切 
yE[Lz 一 ,zz 十 8j 有 FFCy) 委 开 
设 7 全 从 - 大 人 佳 得 六 < 一 权 六 传 很 CD fr | 遇 4 
你 ”天 AL 大 ,使 得 7 (LA 人 9 十 1_Jj。 AAA Ah 
Pr \ rr |~、、 一 1 mvn (AN Ar NA2 
\ | Jan / JJ\ 7 1 一 E/ 一 L\ Jo 之/ /之 /7/ 
必 
一生 人 (下 1 
入 本 1 ( 广 (Zz) 一 下 万 (Z)) 
1 
AN Ar vvNNV2N 1 aN 
”NA L7L JJ 、-L7A 上 | \\ 王 。 JU 7/ 
我 们 指出 
1 1 
Pr Pr 一 N (如 
有 人 vv 媳 NA/ 77 帮 LAL An、LAi7 
TiI 一 1 


区 
曙 


Q, (人 入;) 一 了 cm ,ti ] (从 划一 下 (on ,人 (入 ;) ) 


《 开 


严 
ECoCX) 关 入 |。 COy)dy 云天。 


于 是 








1 及 , 必 扩 
天 LA(Cz) 一 下 CCz) 站 扫 2 一 一 0 
1 岂 ， 17] 九 ， 
-~ 六 订 
上 AL HU ?》 
《7Pm) 
下 
Pr AN 了 工 fr rr AN  _ Ar - ， 
也 太 ( 代 ) 太一 大 7 591 
员 对 


故 从 (4. 3) 推 知 (4. 2) 成 立 . 


经 过 更 深入 的 分 析 , 可 以 证 明 ( 见 113j) ; 若 密 度 函 数 FCz) 在 
者 068 全 


(一 ceoyco) 上 一 致 连续 ， | [zjsFGz)dz < ceo( 对 某 个 8G 盖 0) ,又 


工 工 工 7 


P(lim sup| 六 (Cz) 一 Frz)|=0)=1 
这 表明 广 (z) 有 一 致 强 相 合 性 ， 


map 入 
(二 ) 核 估 计 法 
在 忆 |: 扩 _- 般 的 核 估 计 之 前 , 先 讲 一 . 个 .出世 克 忧 和 形 [人 便 读 了 老 理 蚀 壕 代 计 
小 L 1 人 刀 有 JELEA II YY 一 一 时 3 .LE 1 1 可 和 下 1 有 AL 9 扩 AI 民 下 月 娃 提 人 疏 


思想 . 设 X 的 分 布 函 数 和 密度 函数 分 别 是 FFGCz) 和 zcz). 若 FCz) 连 续 , 则 
很 小 时 有 
三 ( 并 十 产 ) 一 下 (一 大) 
2 


而 F(Cz) 可 用 经 验 分 布 函 数 F, (zj 来 估计 ,从 而 可 用 
六 (z) 一 寺 [F,( 工 十 用 _FCz 一 闪 ] 


、z jzZ) 


来 估计 .FCz), 这 叫做 7FCz) 的 Rosenblatt 估计 ,是 M， Rosenblatt 于 1956 年 
首先 提出 来 的 . 不 难看 出 ， 
遍 Te -HH (Xi ) 
、 = 
本， zE [一 1,1) 


\0， ”其 他 
则 





、 1 芯 并 一 从 
六 (= 需 Ko 人 | 
即 太 (z) 可 以 通过 一 个 “ 核 函 数 ”Ko(Cz) 表 达 出 来 . 
定义 4.2 设 天 (z) 是 (一 ce， ,co) 上 的 非 负 函 数 且 | 。 天 (z)dz 一 1， 则 称 
天 (Zz) 是 核 苯 数 ， 此 时 称 
产 (z 六 = 去 2K (于 一 - ) (4. 4) 


为 FCz) 的 核 估 计 . 
核 申 数 入 Cz) 有 很 大 的 选择 自由 ,类 型 很 多 , 如 
。69 。 


电 且 癌 尽 e 世 ， 





0， 其 他 
fl， |zl 入 1/2 
| 

0， 其 他 

] 1 2 
开 ， (Z) 一 e Zz 
2 V 了 于 
Ki(z) 一 一 





可 以 证 明 ,在 一 定 条 件 下 , 核 估计 具有 相合 性 


-上 一 


定理 4.3 设 核 表 数 天 (z) 满 足 条 件 : 
| (K(Cz)) dz < ce， 本 |z|KCz) 一 0 
又 密度 函数 在 点 z 连续 , 扩 一 0 且 zi 一 ceo(C 一 co), 则 对 一 切 e 之 0 有 


2 ww | me 


im 天 | 户 (z) 一 FGz)|e) 一 0 
其 中 请 (Cz) 是 FCz) ) 的 核 估 计 ， 


ae 





-去 半 K( 


证 了 明 :首先 证 明 8 
lim 已 FF (Cz) 一 FCz) (4.5) 


实际 上 ， 





EF(z)=| 5K( 玩 )7CDdy 


= | KGoFCz 一 a)dz 


ee 


| 已 AF(Cz) 一 FCz) | 一 罗 长 zz 一 At) 一 大 zz)jd 


卫 ， 六 】 本 到 


与 
名 


< sup， |Fz 一 如 zx) 一 COz)| 


| | 入 ak 一 


十 sup 天 (x)。 | AZ 一 jos)ds 


| “| >eh 





:| 天 (z)dz 
| w | 全 0 


<< suP | FCz 一 y) 一 xz) | 


| 
十 0:。 sup |KCo| 
| | >sh 


+ (ze)dz (S 过 0) 
利用 这 个 不 等 式 , 不 难看 出 (4. 5) 成 立 . 














现在 来 证 明 : 
lim Var(CF (zxz)) 一 0 (4. 6) 
实际 上 ， 
Tv |Kfz 一 AN | 
Var(C 矿 ,(Zz)) 一 交 Var| 产 天 人 ) 
-一 1 (f” 工 [KKfz 二 2) |] rC yd 
全 一 下 L /人 
= 南 | [KGCoO]FCz 一 请 adz 
- | [KGoO 了 | FCz 一 六 za 一 Foz) |dz 





十 一 jz)| [ 必 Cz)]zdz 





< 让 sup |7(z 一 少 一 FaD| | KGo]du 





十 二 -| CCKCGoO 了 FGz 一 ia)dz 


2 
十 起 /CoD| CCKGoO)?du 


委 oGD 十 -sup [KG Cn- co) 


(人 | | > 弘一 
sup [zxK(Cxe) (> co) 


< o(C1) 十 
， 1v | > 上 2 了 


了 了 工 
12G 7 
一 0(C1) (7 一 co) 
这 就 证 明了 (4. 6) 成 立 . 
于 是 
。 7T 。 


P(C| 产 (z) 一 fn)| 昌 的 记忆 [ 产 。(z) 一 Fez)]: 


委 二 (Var[ 广 (z] 十 [E 广 (Cz) 一 FCz)]?) 
E 人 


一 0(1]) (2 _> co) 
证 毕 ， 
经 过 更 深入 的 分 析 ， 可 以 证 明 ( 见 [13】]) : 若 密 度 函 数 f(z) 在 (一 co,co) 
上 一致 连续 , 且 
limA 一 0， > ,exp{ 一 放下 2” ) << co 【一切 y > 0) 


严 一 ] 








只 要 核 郑 数 选 得 适当 , 核 4 住 往 比 图 较 好 的 精 
度 ,我 们 不 加 证 明 地 指出 下 列 事实 : 设 六 (Cz) 是 前 面 介绍 过 的 
Rnm<ernhHao+r+ 仁和 注音 这 且 和 锁 性 下 的 枕 什 计 人 本 Ar 有 且 圳 
了 NI LOCLL DT 1 世 LA 9 全 人 上 小 | JJZRNNJTTA IN YI 931J jn、\ 咏 LA 人 人- 已 L 
方 图 估计 ，, 即 
矿 (Cz 人 人 《 允 ) ) 当 CC (7) ,上 2] 则 当 六 -0 目 
ee 
ET 六 (Cz) 一 Fr) 一 OCz 否 ) 
E[AF(z) 一 Fr) 一 O(0z) 
换 句 话说 ,Rosenblatt 估计 比 直方 图 估计 有 较 小 的 渐 近 均 方 误差 


(三 ) 最 近邻 估计 法 
,是 样本 . 1965 年 Lofts- 


， 
garden 和 Quesenberry 妇 出 下 列 最 近邻 估计 法 选 定 目 然 数 
天 (2)， 令 
azZ) 一 min{t:， RR(Cz 一 力 工 十 办 之 天 (7m)) 
天 (nz) 
]《 工 1/ 27Q (并 ) 


其 中 
。 7I 。 


人 玫 (Z 一 1 工 十 t) 一 -一 SVTL， 十 菇 (Xi) 


1 一 1 


生年 本 沙 作 区 癌 (z 一 六 并 十 菇 的 频数 


”万 () 册 做 三 Cz) ) 的 最 近邻 估计 
各 过 深入 研究 ， 可 以 证 明 ( 见 [13 下 列 结论 : 耕 F(Cz) 在 


(一 co co) 上 一 致 连续 , 且 


. 天 (7 ) 天 (7 ) 
im 全 me 一 0， lim 人 22 一 
7 人 2 | 工 Yi 7 
则 
DA1- 、 .| _ 1 
Ai SuUP | 一 上 
大 
训 fy 的 _ ga 
hP JI7AE -7 DR 二 JR 7 





1. 设 和 服从 几何 分 布 
P(X 一 &) 一 思 (1 一 四 和， 有 一 1,2,… 
Xi，X:，…X。 是 X 的 简单 随机 样本 , 试 找 出 之 的 最 大 似 然 估 计 . 
2. 设 X 的 分 布 密度 是 


Hz) = 元 ec (cc 二 0) 
Xi ,X: ，…X。 是 X 的 样本 , 试 求 vc 的 最 大 似 然 估 计 . 


3 设 X XXX 是 来 自 | 2， 6 十 1 上 均匀 分 布 的 样本 甘 中 一 ce-< 一 0 
。 JJ LAI19LA29” , 友 。 是 来 “JLNJTIRRJ IT TI AAS | TU 


去 十 cc. 试 证 明 9 的 最 大 似 然 估 计 不 止 一 个 .你 能 求 出 9 的 全 部 最 大 似 然 人 
计 吗 ? 你 能 找 出 g 的 无 偏 估计 吗 ? 


昌 一 二 


4. 设 随 机 变量 X 以 均等 机 会 按 N(0,1) 分 布 取 值 和 按 Nm ) 分 布 取 
值 (po 未 知 , 一 co 和 <p< 十 co, 咏 >>0). 这 时 X 的 分 布 密度 为 这 两 个 分 布 的 


4 才 上 亚 所 
THJ 一 








大; 7) 一 二 划 -到 十 工 人 e- 二 一 
>[， 7 VE 7 VDTfa 2c 


设 Xi ,X, ，…,X, 为 此 混合 分 布 的 简单 随机 样本 , 试 证 明 羡 和 不 存在 最 大 
似 然 估计 . 
5. 在 买 面包 作 早 点 的 男女 消费 者 中 ,男性 购买 者 的 比例 清 未 知 ,但 知 
。73 。 


道 地 入 pb< 半 . 设 在 70 个 购买 者 中 发 现 12 个 是 男性 ,58 个 是 女性 , 求 己 的 


最 大 似 然 估 计 . 
如 果 对 如 无 限制 (0 委 2 委 1), 求 . 训 的 最 大 似 然 估 计 . 
6. 设 XI ，Xs ，…X， 是 来 自 下 列 两 参数 指数 分 布 的 样本 : 
| 计 s ， 并 之 由 
帮 z30 0 ) 一 
0， Z << 办 


其 中 四 E (一 co, 十 co),2E(0, 十 ce), 试 求 出 和 和 2 的 最 大 似 然 估 计 . 
7 。 设 及 1 ， 入? 入， 是 来 自 下 列 Weibull 分 布 的 样本 : 


一 ez) ， 交 之 0 
上 (Ziay7) 一 四 一 
0， ZI 
8. 设 式 入 1 , 及? ，， …， 久 ， 时 来 自 下 列 下 分 布 的 和 本 ， 
人 Ze eA， 六 之 1 
FCziayB) 1 
0 ， 立 O 


其 中 sc>0,B>0, 试 证 明 wp 的 最 大 似 然 估计 存在 ， 
9. 设 入 1 ) 从， 从 是 来 目下 列 分 布 密度 的 样本 : 
TD4CO 十 1) -1 ， 


FORrTY 0<<><1 
(zy0) 一 1 TO < 去 
1 其 他 


其 中 gE (0, 十 co) ,试用 和 矩 法 估计 
0. 设 从 1 ) 久 ， 从， 是 来 和 目 分 布 密度 为 
太 zjzcy0) 一 3505 -所 工 ) 


和 c 和 0. 
1. 设 入 1 ) 信 ， 从， 为 No ) 分 布 的 样本 ,参数 HG 未 知 ( 一 ce 所 


-一 ~ 2、~、_nN 人 
AR 十 coy0 -一 vvVA AR 


习 一 一 工 >CxX,- 一 观 ): 


1 一 1 


1 COX 一 到 ): 





e。 14 。 


证 明 对 所 有 可 能 的 w 和 。: 的 值 , 帮 为 * 的 估计 ，S; 的 均 方 误差 比 S; 的 均 方 
误差 都 小 , 即 Si 比 Si 有 效 ,但 Si 是 无 偏 估计 而 Si 不 是 ; S; 是 最 大 似 然 
估计 . 


17D 3 A os 
了 人 姜 LT 9 LDO 9 儿 





其 中 > 0， 忆 》 Xi, ) 是 (av 有 ) 的 充分 统计 量 . 
13. 设 入 1 ， 入 9 1 的 Polsson 分 布 的 样本 ， 试 证 及 以 
和 S:? 一 一- 2 cx X)? 都 是 ) 的 无 偏 估计 ,并 问 :是 否 还 有 其 他 的 无 偏 
估 讨 ? 
1 4. 设 入 1 ， 从 ， 从， 是 来 自 下 列 二 项 分 布 的 样本 : 
P(X 一 &A) 一 CO] 





一 On ， R 一 0， ，…，771 


试 求 引 的 无 偏 估计 . 
15. 设 其 ,X ，…X。 是 来 自 参 数 为 人 的 Poisson 分 布 的 样本 , 试 求 关 
的 无 偏 估 计 . 
,X。 是 来 自 正 态 总 体 Ng) 的 样本 , 试 证 明 


16. 设 和 ， 和 ，… 





> (和 从; 一 X): 
1 一 ] 


是 c 的 无 伺 估 计 . 
17. 设 Xi ,Xs，…，X。 是 来 自如 下 密度 的 Pareto 分 布 的 样本 : 


re -1 
0， 


其 中 06 (1 十 ce), 试 找 出 0 的 无 侦 估 计 . 
185. 人 讽 从 1 , 入， 入， 是 来 自 下 列 分 布 密度 的 总 体 的 样本 : 


1] _1， < 
| 二。 5， 工人 0 
了 了 \ 芝 5U/ 1 
OU， <CO 


其 中 0>0, 试 找 出 9 的 无 偏 估计 的 方差 的 尽 可 能 大 的 下 界 . 
介 1/D 当 


19. 设 Xi ,X，…,X。 是 来 自如 下 密度 的 Cauchy 分 布 的 样本 : 
1 

rL1 十 (z 一 历 实 

其 中 OOE (一 co ,十 ce), 试 拔 册 b 的 合适 估计 (要 芭 说 明理 由 ) 


7 Sum 下 有 。 2 PP UV NA 了 AU 悍 由 ) 


0. 设 X 取 值 1 或 0, 概 率 分 布 如 下 : 
pr(1 一 0)*， 当 0 是 有 理 数 
上 (人 公 一 并 ) 一 YY . 1 上 产 iT 
UL 一 0)750 一 ， 当 是 无 理 级 


其 中 gE (0,1)，,z 一 0，,1. 设 XXX，… …， 太 ,是 从 的 样本 , 试 找 出 0 的 最 大 似 然 
仕 计 、 


CCZ3 0) 一 


的 总 体 的 样本 ,一 c2<6< 十 ce , 试 求 出 0 的 最 大 似 然 估计 0 并 证 明 0。 是 强 
相合 的 . 1 

22. 设 Xi ,区 ，…， 太 ， 是 参数 为 1CA0 未 知 ) 的 Poisson 分 布 的 样本 ,证 
明 XXX 是) 的 强 相合 估 计 . 


23. 刘 妈 Wo Brn ON 的 HAT 在 的 直木 这 0 的 型 仁 水 亚 直 
OK < 9LZA2 9 9 《AM AAA\V9UI7 HI JJ NT 9 UV RN IF LS 1 
1 一 a 的 置信 区 间 . 设 得 到 了 5 个 样本 值 0.08,0. 28,0. 53,0. 91,0. 89, 求 0 的 


愤 信 水 平 为 0. 95 的 置信 区 间 . 
4. 设 入 1 ， 入 : 9 入 ， 是 Bernoujli 分 布 DCL , 力 ) 的 样本 , 试 根 据 中 心 极限 
二 汪 榴 7 值 较 大 时 之 的 近似 1 一 a 置信 水 平 的 置信 区 间 ， 


办 亚 UL 世 六 Sr 网 
CD。 妈 人 A 合 19， 人 9 “人 信 ， 是 六 (df ) 的 样本 ,证 正明 样本 方差 





S” 一 太 ， 
-> 


【 一 儿 


的 方 关 为 
2c: 
一 


26. 设 XI ，…，X， 独立 同 分 布 , 共 同 分 布 函 数 是 F(Zz)，Xa 委 Xo 和 安 … 
入 和 是 入 1 ，…， 入 ， 的 次 序 统 计量 . 证 明 : 
(1) 对 一 切 1 委 : 委 2 有 


(7 之 2) 





Var(S- ) 一 
7 


_ 7 | 二 一] 险 一 丰 。 
P(X 入 z) = -TO wp1(1 一 o 一 dz 
(2) 知 下 (z) 是 连续 函数 , 则 


e 70 。 


FELFCXd )] 一 本 5 


， VarLFCXo ) | 二 


、\ 玫 人 /A AL C/ 


27. 用 放射 性 同位 素 法 可 以 客观 地 测定 地 层 的 年 代 , 为 了 研究 这 种 方 


准确 度 , 对 同一 地 层 取 了 19 个 样 ， ,测定 了 年 代 , 数 据 如 下 (单位 ; 百 万 


Ta JR UL 和 JJ 1 2 AL 可 TAN 9 为 JI = 六 ICe 和 7 


年 ) : 
249 254 243 268 253 269 287 241 273 306 303 
280 260 256 278 344 304 283 310 
假设 这 些 数据 是 正 态 分 布 的 样本 , 求 方差 r 的 置信 水 平 为 0. 95 的 置信 区 间 


ni 只- 尖 | 
TH 和 II 比 环 0 的 置信 水 平 为 vvv RJ ID 一 上 |。 


28. 科学 中 的 伟大 发 现 往往 是 由 比较 年 轻 的 人 提出 的 ， 下 表 是 16 世纪 
中 时 到 20 世纪 的 12 个 重大 科学 突破 的 情况 ， 


科学 发 现 科学 家 ”年份 年 龄 
日 心 说 哥 昌 尼 1543 40 
望远镜 及 天 文学 的 基本 和 定律 侦 利 略 ， 1600 43 
动力 学 .万 有 引力 . 微 积分 牛顿 1665 23 
电 的 实质 富兰克林 :1746 40 
燃烧 即 氧化 拉 瓦 锡 1774 31 
地 球 的 演变 莱 尔 ， ”1830 33 
进化 论 达尔 文 1858 49 
光 的 电磁 场 特性 麦 殉 斯 韦 1864 33 
放射 性 居 里 1896 34 
量子 力学 普 朗 克 1901 43 
狭义 相对 论 爱 因 斯 坦 1905 26 
量子 力学 的 数学 基础 薛 定 订 1926 39 


届 所 出 重大 科学 发 现时 科学 家 的 年 龄 服从 N(,c ?分 布 (4,o 未 知 ), 构 造 / 
的 置信 水 平 为 0. 95 的 置信 区 间 . 


。 77T 。 


第 三 章 





81 问题 的 提 法 


上 一 章 我 们 介绍 了 估计 的 方法 ,但 在 实践 中 还 有 许多 重要 问 
题 与 估计 问题 的 提 法 不 同 ,也 需要 我 们 去 解决 请 看 下 列 简单 的 
例子 


LE 和 十 + 盖 - 志 - -II -er 呈 二 中 玉 上 八 《HL AT AZ 了 上 人 TAN 和 人 上 一 | 庆 忆 LI 

b LE 不) 月 一 拔 矿 大 LUU 时 ， 座 玫 人 和 似 拉 人 写 人 镀 放 有 轴 
三 , 按 国 家 标准 ,次 品 率 不 得 超过 3%. 今 在 其 中 任意 抽取 了 10 
件 ,发 现 这 1 件 中 有 2 件 是 次 品 一 人 『 。 ? 


0 
从 直观 上 看 ,这 批 产 品 是 不 能 


ALA 秆 一 一 了。 7 3 一 于 下 


设 这 批 产 品 的 次 品 率 是 问题 转化 为 ， ,如何 根 据 抽样 的 结果 


判 盯 “pp<<3o%2 成 立 与 否 ? 
JE 1 


本 ~ 人 人 7 成 也 ”~ 二 六 ，。 


例 1.2 用 某 仪 器 间接 测量 温度 ,重复 测量 5 次 ,所 得 数据 (CC ) 
是 1250,1265,1 260,1 275,1 245, 而 用 别 的 办 法 测 得 精确 温度 是 
1 277( 可 看 作 温 度 的 真 值 ) , 问 此 仪器 间接 测量 有 无 系统 偏差 ? 


用 么 代表 用 这 个 仪 瑚 测 得 的 温度 全， 当然 这 是 一 个 随 


变 
到 的 5 个 数据 是 和 的 一 个 样本 . 问题 化 为 :如 何 判 断 等 式 


“一 


N 


八 = 


量 ,得 
“EX 一 1 277? 成 立 与 否 ? 

例 1.3 在 针织 品 的 漂 日 工艺 过 程 中 ,要 考察 温度 对 针织 印 
断裂 强力 (主要 质量 指标 ) 的 影响 ,为 了 比较 70 人 与 80 已 的 影响 
有 无 差别 . 在 这 两 个 温度 下 ,分 别 重复 作 了 8 次 试验 , 得 数据 


70 人 时 的 强力 ;20.5,18.8,19.8,20.9,21.5,19.5,21.0,21. 2 
80 他 时 的 强力 ;17.7,20. 3,20. 0,18. 8,19. 0,20. 1,20. 2,19. 1 
e。 78 。 


究竟 70 人 时 的 强力 与 80 人 时 的 强力 有 没有 差别 ? 用 X 表示 
70 C 时 的 强力 ,Y 表示 80 人 时 的 强力 ,问题 变 成 :如 何 判断 X 与 


YY 且 砂 竟 内 后 直上 人 机 7 
4 外 呈 JiT TPRJLALJOTN ，。 


例 1.4 为 研 守 抽 烟 与 慢性 文 气管 炎 是 否 有 关 , 幸 查 了 7 个 


I 邓 上 一 一 上 一 上 1 站。 一 和 大 一 页 2 


人 ,数据 按照 是 否 抽 烟 与 是 否 患 病 ( 慢 性 支气管 炎 ) 可 列 为 下 面 
2X2 表 


| 有 病 无 病 

抽烟 701 7712 

不 抽烟 允 7222 
从 又 1， 和 若 抽 烟 v 11， 大 有 病 

-一 9 - 王 : 
0， 知 不 抽烟 io， 震 无 病 
问题 化 为 判断 “X 与 Y 相 五 独立 ”是 否 成 立 . 
克 7 到 | 人 z 42 韦 4 下 全 


例 1.5 怎样 根据 一 个 随机 变量 的 样本 值 ,判断 该 随机 变量 
是 否 服从 正 态 分 布 NCuso2)3 

更 一 般 地， 如 何 根据 样本 去 判断 随机 变量 以 给 定 的 函数 
Fu(z) 为 其 分 布 函数 ? 

这 些 例 子 所 代表 的 问题 是 很 广泛 的 . 其 共同 点 是 从 样本 值 出 
发 去 判断 关于 总 体 分 布 的 一 个 看 法 "是 否 成 立 ,, 例 1. 1 的 看 法 是 
次 品 率 pm 和 0.03 ，, 例 1.2 是 -下 X 王 1277， 例 1.3 的 看 法 是 X 己 
Y 有 相同 的 分 布 ， 例 1.4 的 看 法 是 “X 与 Y 相互 独立 ”， 例 1.5 则 


Wi 


是 -X 的 分 布 图 数 是 下 。(Cz) 


4h 王 站 29VDUHH4AE3S 2 
有 合 反 人 1 HE 。 


这 些 就 是 所 谓 假设 检验 问题 (或 叫 假设 的 鉴定 问题 )， 
本 章 介绍 假设 检验 的 基本 理论 知识 和 一 些 常用 的 检验 方法 ， 
淹 革 所 关 必 的 “假设 ?是 否 有 成立， 


LA 


例 1.1、 例 1. 2 和 例 1. 5 中 “假设 ”都 是 关于 一 个 随机 变量 的 

分 布 的 判断 ,这 叫做 一 个 总 体 的 检验 问题 , 例 1. 3 和 例 1. 4 的 “ 候 

设 * 是 关于 两 个 随机 变量 的 分 布 的 判断 ,这 叫做 二 总 体 的 检验 问 
。 70 。 


题 . 也 可 以 考虑 三 个 或 更 多 个 总 体 的 检验 问题 . 
我 们 主要 论述 单 总 体 的 检验 问题 . 把 我 们 要 检验 的 “假设 ” 


记 作 百 〈 通 堂上 明和 做 堆 假 设 ) ,万 是 关于 隧 机 变量 ( 冲 体 》 的 分 布 
7 <40N\ AN MI 由 RUOC 7L 9? 0 人 人、 下 /NT 7 NA TIE 


的 一 个 ” 和 说 得 更 确切 些 , 设 的 分 布 了 图 数 为 下 (z,0) ,其 中 


0 展 了 个 写生 太 m 人 全 人 /7 昌 心 * 光 (会 -一 EL LO rr -~ 人 住 
v /同心 人 引证 一 -| 已 知 集合 (是 实数 集合 ， 或 回 量 组 成 之 集 


合 , 也 可 是 页 般 的 符号 组 成 之 集合 ). 零 假 设 瓦 通常 可 以 


器 一 


表示 成 这 样 的 形式 :be Bu ,这 里 @ 是 9 之 非 空 真 子 集 . 通常 把 
E 四 一 日” 叫做 对 立 假 设 ( 或 叫 备 择 假设 ) , 记 作 互 。 或 五 ;. 
怎样 根据 样本 值 对 妃 。 进行 检验 呢 ? 这 就 需要 对 “检验 法 ”给 
出 合理 的 定义 .直观 上 说 ,所 谓 一 个 检验 法 ,就 是 给 出 一 个 规则 ， 
对 给 定 的 样本 值 = ,…,z, 进行 明确 表态 :接受 假设 鼠 , 还 是 拒绝 


EX DC 0 

用 数学 语言 可 以 说 得 更 清楚 些 , 设 S 是 所 有 可 能 的 样本 值 
(zi Zn)(2 固定 ?组 成 的 集 合 (样本 空间 ) ,所 谓 一 个 检验 法 就 
是 指 空间 S 的 一 个 划分 :3= 3 U S: (SS， 村 S: 不 相交 ). 当 
(zi yz)ES 时 接受 假设 万 , ; 当 (CZ ，…，Z， ) 多 上 ? 时 拒绝 万 。， 
这 ,上 叫 控 收 域 ,SS 叫 示 定 域 因为 SS 一 SS 一 S 帮 只 要 知道 了 否 
人 一 1 1 “| 人 2 ”区 51 2 9 AAA AH 人 J 


定 域 ， 就 知道 了 检验 法 : 每 个 检验 法 对 应 一 个 否定 域 ;反之 , 任 给 
定 S 的 一 个 子 集 机 ; 则 有 一 个 检验 法 以 厂 作为 它 的 否定 域 . 故 研 
究 检验 法 就 相当 于 研究 否定 域 为 便于 数学 处 理 ， 通常 要 求 否 定 


了 闪 和 上 -了 ae iv cm -也 


域 是 样本 空间 S 中 的 Borel 集 .S 中 的 Borel 集 太 多 了 ,究竟 应 选 
刀 一 个 对 检验 再 是 最 合适 的 呢 ? 这 就 涉及 检验 法 优良 性 的 标 


二 二 者 w mm 一 一 


准 . 为 了 分 术 这 一 问题 ,我 们 看 看 在 取 定 一 个 全 定 己 允 ( 即 选 定 一 
个 检验 法 ) 后 ,有 什 次 后 果 : 


Ta 7 7 AT 


零 假 设 万 ,在 客观 上 只 有 两 种 可 能 性 : 真 . 假 . 样本 值 
/NIHD 妈 ATE3Shechh 民工 crhTr -人 屋 荆 TUr 芷 王 
\-L1 9? ?nn] LE 人 八 月 户 J 人 了 可 月 台 芋 :/ 册 」】 中 人 ET 人 /二 站。 和 不 


@ 本 章 只 研究 这 种 固定 样本 量 的 检验 法 .至 于 样本 量 麻 固 定 的 情况 ,现代 也 有 
大 量 研究 , 归 遍 于 数理 统计 学 的 一 个 分 支 一 一 序 贯 分 析 , 见 第 六 章 . 


ee gbO 。 


用 人 W 作 否 定 域 , 则 在 观察 到 样本 值 (z， 3” ,Za) 时 只 可 能 有 下 列 四 


神情 人 纪 : 
rd4NTT 雷 订 ([( 、  。。 ) 属 于 克 ; 
VIA LELO sy UV-L1 9， 7 /于 本 Y 


(2) 。 真 , 而 (zj ,…,z,) 不 属于 砚 ; 


\《D) Lo 假 ， 而 (CZl ，，… ，， ) 属 于 YY 
(4) 百 , 假 , 而 (z ,zz ) 不 属于 环 . 


<<0 1 


根据 我 们 的 规则 ， 在 情形 (1) 应 拒绝 万 , ,在 情形 (2) 应 接受 


FT7 让 导 形 《MAN 人 婕 亢 导 形 (4 过 三 了 小 去 开 2 QQNJJA 
< 上 40 ,在 情形 (3) 应 拒绝 互 。…% 在 情形 (4) 应 接受 44L0。 情形 4 人 2)、(3 ) -二 


然 好 ,对 万 的 表态 与 客观 实际 相符 . 但 (1)、(4) 两 种 情形 下 , 表 
态 犯 了 错误 :与 客观 实际 不 符 ., 在 情形 (人 1) 下 出 现 的 错误 是 把 本 来 
真实 的 看 法 互 。 进行 了 否定 ,这 种 “以 真 为 假 ” 的 错误 叫做 第 一 类 
错误 . 在 情形 (4 下 出 现 的 错误 是 把 本 来 虚假 的 看 法 瓦 。 接受 下 
来 ,这 种 “以 假 为 真 ” 的 错误 叫做 第 二 类 错误 . 由 于 样本 值 有 随机 
性 ,这 两 类 错误 一 般 难以 避免 . 


四 J 一 飞 7 


样本 值 之 1 9 “na 7] 了 人 件 人 中 个 19? 入， 


和 答 号 . 


| 


用 P(A10) 表 示 X 的 分 布 的 “参数 "的 真 值 是 0 时 事件 A 发 生 
的 梳 避 (或 用 让 P,(A)). 


_pccx 区 ) 蕊 几 加 


ov (b)- 二 P( 拒 绝 万， | 0) 
一 已 CCXI 和 …X)E 太 10) 
Lw(0 叫 做 检验 法 (否定 域 ) 的 操作 特性 函数 (简称 OC 盯 数 )， 
poy(0 叫 做 叉 的 功效 函数 . 显然 Lw(0) 王 1 一 ow (0)， 
当 b6e@s 时 ,ow(0) 表 示 犯 第 一 类 错误 的 概率 . 当 06E@u 时 ， 


1 一 oy (g) 表 示 犯 第 二 类 错误 的 概率 . 我 们 自然 希望 选取 这 样 的 否 
。 581 。 


定 域 , 它 犯 两 类 错误 的 概率 都 很 小 . 换言之 ,我 们 要 求 功 效 男 数 
ow (0) 当 0E Bu 时 很 小 , 当 0EB@u. 时 很 大 . 


和 请 憾 的 且 和 计 纶 定 的 梯 本 县 来 诗 一 般 页 论 第 -类 狩 识 的 
站 司 的 证, 对 给 和 定 的 伞 本 量 半 来 讲 , 一 般 而 论 , 种 一 失 敌 话 的 


概率 小 时 ,第 二 类 错误 的 概率 就 大 ,反之 亦 然 . 因而 不 能 做 到 两 拓 


4 廿 > 己 由 和 ET 水 z 尼 人 节 辣 / 了 目 RTV 估 琴 法人 址 
销 疼 的 概率 都 任意 小 . 三 | 以 问题 的 正确 手法 是 : AL TY 以 1 六 用 


误 的 概率 都 尽 可 能 的 小 . 
通 音 称 sup ow(0) 为 太 的 检验 水 平 册 (也 称 显 著 性 水 平 简 称 水 


< ON 
2 


实际 工作 中 常常 这 样 提 出 问题 :对 给 定 的 小 正 数 w( 通 常 
5 或 0.01) ,如 何 从 检验 水 平 不 超过 w 的 所 有 否定 : 


AZ 9 AD ALAA 惟 大 避 人 过 芝 有 /2 


监 到 


中 选取 犯 第 二 类 错误 的 概率 尽 可 能 小 的 否定 域 ? 
我 们 党 把 要 考虑 的 检验 问题 用 下 列 符 号 表示 
万 :0OE BO06E 9， 
这 里 五 。 是 待 检验 的 “假设 ”, 巨 . 是 备 择 假设 ,9: 与 9, 不 相交 . 在 
很 多 情形 下 ,人 一 外 一 过 
定义 1.1 称 克 是 检验 水 平 为 的 一 臻 最 大 功效 的 否定 域 
(简称 UM 下 否 宇 碟 ) , 行 克 的 水 平 为 wa 而 且 对 一 切 水 平 不 超过 ma 


ov (0) 之 oy(0) (一 切 O6G;) 


ve 位 网 只 


能 找 出 一 臻 最 大 功效 的 否定 域 当然 好 ,可 惜 这 种 否定 域 难得 
存在 ， 比 “一 致 最 大 功效 " 较 弱 的 要 求 是 “一 臻 最 大 功效 无 偏 ”.， 
定义 1.2 称 允 是 检验 水 平 为 w 的 无 偏 否 定 域 , 若 对 一 切 


0 怨 : ,有 
Ow(《O) 之 a 
无 偏 性 是 很 自然 的 要 求 , “假设 " 在 它 真 实时 遭 拒绝 的 概率 不 
大 于 它 虚 假 时 遭 拒 绝 的 概率 . 


山 有 时 称 中 四 ow(9) 为 网 的 精确 检验 水 平 . 给 定 正 数 x(0 和 ac<1) ,精确 检验 水 
平 恰 为 a 的 否定 域 W 不 - 定 存 在 ， 当 历 的 精确 检验 水 平 不 超过 au 时 ,有 时 也 说 机 的 
检验 水 平 是 vc. 
稚 82 当 


定义 1.3 称 允 是 水 平 为 c 的 一 臻 最 大 功效 无 偶 否 定 域 , 乔 
平 为 x 的 无 侦 否 定 域 , 而 且 对 任何 水 平 为 x 的 无 候 否 定 域 


SS 


画 i 


水 
有 


吕 


ov(0)og(9) (一 切 be el) 
以 后 将 会 看 到 ,大 量 种 用 的 否定 域 是 一 臻 最 大 功效 无 偏 的 
C(UMPU)， 


在 以 上 乍 义 里 “否定 域 ? 一 词 均 可 用 “检验 法 ?或 “检验 ”代替 . 

寻找 一 臻 最 大 功效 (或 一 致 最 大 功效 无 俩 ) 的 否定 域 ( 检 验 法 ) 
是 相当 复杂 的 问题 ,需要 对 零 假 设 克 ,的 具体 结构 及 总 体 X 的 概 
率 性 质 进 行 具 体 分 析 . 在 许多 情形 下 已 有 很 好 的 答案 ,还 有 许多 
情形 尚未 研究 清楚 或 答案 不 够 邻 人 满意 . 从 $ 2 起 我 们 对 一 些 重 


要 的 特殊 情形 进行 讨论 . 为 了 似 述 明确 起 见 , 在 一 些 和 定理 的 叙述 


由 抽 和 四 宇 盾 二 让 县 旦 并 类 刑 训 法 也 不 3 此 安 押 的 2 人 于 [ 
于 志 取 和 牙 | 电 人 福星 年 过头 生 有 JJ， 导 有 不 难 验 证 ,这 些 定 理 的 擂 / 心 “ 


推广 至 离散 型 随机 变量 ,证 明 方法 基本 不 变 , 只 需 将 积分 号 换 成 求 
和 号 . 
作为 本 节 的 结尾 ,我 们 指出 假设 检验 的 接受 域 与 置信 区 间 有 


一 种 简单 而 次 刻 的 联系 . 设 X 的 分 布 图 数 是 F(Cz,0),0 是 未 知人 参 
数 , 和 一 (XI 和 …,X。) 是 X 的 样本 . 考虑 检验 问题 : 


克 。 :0 一 0 一 甩 ; :OO 


设 A(b) 是 互 。 的 接受 域 ( 检 验 水 平 不 超过 ac), 即 当 且 仅 当 样 
本 XXX 的 值 属 于 A(b ) 时 接受 假设 五 。, 且 


和 村 和 


P(CXEA()16) 去 n 
令 SCX) 一 10:XEAGCO) , 则 对 一 切 0 有 
DYv 0 一 Cr vv | ON~、1 _ 
US \ 息 7/1U7 一 上 伺 
由 此 可 见 ,如果 S(CX) 是 区 间 , 则 它 台 是 0 的 置信 水 平 为 1 一 
的 置信 区 间 . 
例 1.6 设 和 ~ 人 (0 1) ,06 (一 coyco)， 入 一 (XXX ) 是 


X 的 样本 . 对 于 检验 问题 : 
” 0 一 0 一 OO 


A(O0) 一 (CCzl 7Z，) Z 一 四 | 和 C/ 


其 中 5= 工 >)z 9 ( 满足 


1 


旦 


杞 
吕 
开 


区 


己 A(O) | 0 ) 一 


1 一 wa 水 平 置 信 区 间 . 
以 后 将 看 到 ,在 许多 具体 的 假设 检验 问题 中 稼 可 选取 具有 某 


和 和 和 


优 妇 性 的 接受 域 , 因 而 根据 接受 域 构 造 的 置信 区 间 也 有 其 优 肯 
记 


我 们 首先 考虑 最 简单 的 情形 。 设 X 一 Gz,07,，0EG9== 
人 00 六 0)，, 设 X 是 连续 型 随机 变量 ,密度 果 数 是 ACz,O) 


Ri Te ae 二 一 


(对 离散 型 随机 变量 可 进行 类 似 的 讨论 ). Bo 三 40) 检验 问 
题 是 : 


万 ， ;0 一 0 一 万， :0 一 0 


7 上 -本 


3 昕 rr .TREETA 
这 和 的 人 御 省 证 人 六 从 / 尿 


。。 县 #7EO bnPR2 3 
1 9 9 人 7》 门人 1 二 AL JR 了 AHUHJ DA ALC ， 二 
刀 


Zz 一 (ziz)， dz 一 dzidz…dz， 工 (zy0) 一 | FFGCz 0)， 


1 一 】 
定理 2.1(Neyman - Pearson 引 理 ) 给 定 wE(0,1), 设 
。84 。 


Wu 一 (ZLCZ0) 二 人 oLCZzyO)) 《2. ] ) 
(这 里 io 这 0) 适合 


| 


iT 7 门人 _ 7 人 四 以 
| | 二 00 《2L. 2 1) 


则 对 任何 和 否 乍 域 WCR", 只 要 ow(0 < 了 吏 一 一 乍 有 
Cw。 《02 ) 之 Ow (02 ) 


ee LT 工 M TIr 上 EF-E ATA_ 3 HDL WO TR tbhrP xnAS 一 了 
拓 同 四 py 下 和 人 似 开 小 和 小 有 曲 过 有 在 年 民 下 人 市 一 大 


错误 的 概率 最 小 的 一 个 . 
证 明 : 设 岁 是 任何 满足 ow(0 入 c 的 否定 域 , 则 


COw。 (0 ) 一 0Ow(02 ) 


一 了 ((X，…X)EWo0) 一 POCOXI 和 …X) E 太 0) 


-| .|Pzb)dz 一 | …|LGzb)dz 
JW J J 权 J 


“| 二 (， 


…|L(zyg)d， 
| 


CN 
CO 


>>ho| | Le )dz 一 1， zeodz 


= io|| …|LGzbDdz 一 | |LGzseDdz 
W， “YY  ， - 


v 0 
一 Mo[c 一 ovw(0) 门 三 0 证 毕 . 
定理 2. 1 万 是 统计 学 中 著名 的 N-P 引 理 , 它 断言 否定 域 
Am 1TA\ 四 下 /LT7A TI AAA 一 一 己 六 HT DA 已 ) 人 人 人、 2 二 上 T 二 
\C 7 六 有 有 上 归 几 II 二 人 浅 市 一 类 错误 的 概率 最 4 仆 ) 过 】 记录 -人 区 
示 为 : 


丸 一 (人 Z:A 二 0 (2. 3 ) 


其 中 一 1(Zz) 一 LOz0)/LCz 0 叫做 似 然 比 . 这 个 否定 域 确定 
的 检验 法 叫做 似 然 比 检验 法 . 满足 (2. 2) 的 1 是 否 存在 呢 ? 当 似 
5 8WD 。 


然 比 X(X) 的 分 布 函数 连续 时 ,不 难看 出 确 有 io 满足 (2.2). 了 dd 
N -了 P 引 理 告 诉 我 们 , 似 然 比 检验 法 具有 最 优 性 . 自然 问 : 是 


耕 主 别 的 检验 尘 后 位 负 让 检验 法 一 樟 伏 ? 分 析 定 理 ?2 ] 的 评 明 
倘 还 有 章 的 检验 法 -可 比 检验 法 一 样 优 ” ，， 几 风 II 生生 的 证 有 明 
过 程 个 难得 玫 下 惟一 性 结 让 ， 


V 器 冲 8 
本 
= 
\ 部 
> 
可 
” 苦 
4 次 
Y 
\， 
- 


二 十 《下 人 Ar 一 了 


中 当 )(CX) 的 分 布 函数 不 连续 ,尤其 和 本 身 就 是 离散 型 随机 变量 时 ,可 能 不 存 
在 这 样 的 1o. 


二， 当 zE|10,1 |， 
rd > er 
1 ?9 过 志 记 、 J 

0， 其 他 
f < > 一 rr、 1- 
| 忆 工 气 LU |， 
人 zy02z) 一 ] ?Yiz vv / 门 表 ] 
3 ， 之 L92 |， 

0， 其 他 

各 样本 量 ”一 1, 则 似 然 比 为 

[2， 当 XELo,1]， 
OO- 到 当 XE(1,2] 

\ 任 意 值 ， 其 他 


| 工 
| 3 


YL 二 ee 
9 二 A0 四 


挛 二 


1 WO 
用 亿 oa 卫 周 玫 月 4 注 和 下 2 人 )， 


。86 。 


的 含义 是 : 符 克 也 是 水 平 为 we 的 最 大 功效 的 否定 域 , 则 A 克 公克 。) 


一 0( 是 Lebesgue 测度 ,WA 人 Wm (太一 克 ) UVW， 一 丸 ) )， 
证 明 : 由 于 AX(CX) 的 分 布 函 数 连 续 , 故 有 Mo 六 0, 使 得 


<- 9 [ 


PN、~、1 0》 一 ~ 

“、 作 人 7 一 人 0O 217 大 
一 一 IT 本 百 万 =- < 六 3 mL TEX7 了 Cn 克 记 《下 一 人 =- 上 上 人、TA 1- AT 一 十 后 
本 和 下风 昌 永和 证， 芭 几 十 让 一 本 玉 ， 似 投 水 和 在 起 过 a， 
有 即 PC(XE 克 10) 和 ac。 我 们 来 证 明 ; 特 w 太 人 人 克 >0 则 必 有 
5 六 1 AZ CA ae 『 JJ Ae UL AAAJ 。 天 人 日 了 一 AN -和 可 

P(OXEWo|b) > PCXE 了 页 10) (2. 4) 
实际 上 


P(XEWo|p) 一 己 ( 以 E 克 0) 
一 | Fz0)dc 一 | 了 (zzb )dz 
多 0 W 


=| 工 (50)dz5 一 | (50)dz 


二 0 


这 里 及 下 面 我 们 便 用 | 代替 | …| .分 两 种 情况 讨论 


(一 ) ALW 一 多) 全 0 


| Lorbydz>il Troy)dz 
JWI-W 一 和 JWI-W ~ 一 


但 在 网 一 风 。 上 上 了 (zyl0) 入 1o7L(Z ,0 ) , 故 


P(XE 丽 ,10) 一 P(XE 克 10) 


一 4o 


矿 1 


L(zy0)dz 一 | LCzyO)dz 
” JW-w Y 


允 0 一 多 0 


-一 


人 一 


MoLP(CXEWol0) 一 PCOXE 克 0) 过 0 
故 (2.4) 式 成 立 . 
生 7 三 


(二 ) (了 一 1) 二 0 

今 
门 一 (7. 六 区 nm T7T( > 一 
/ 这 : 议 民 ,了 人，02 ) 


因为 1(X) 的 分 布 函数 连续 , 故 PCXEDI0) 一 0, 即 
| 工 Gzsb dz=。 


7_( )》 
< 】 


之 ytU 
Au 


但 L(zy0)0, 故 人 (有 D) 一 0. 从 而 
| LGzyb)dz=| LOzb)dz 


JW 一 W。 J W 一 (WUD) 
< 忆 | )o 了 (并 ,0 ) dz 
由 此 不 难 推 和 (2.4) 仍 然 成 立 . 证 第 . 


我 们 还 指出 ,上 述 似 然 比 检 验 法 还 是 无 偏 的 . 
定理 2.3 在 定理 2. 1 的 假 乍 下 
COw， (02 ) 之 a -一 Ow， (0 ) 


证 明 : 记 W8 一 和 一 W。, 则 


pow (6 ) 一 o= 一 | L(Cz,p)dz 一 


Yo 


入 


『 站 
一 |。 (1 一 a) 工 (zy0 7)dzZ 一 吕 工 (天 ' 汪 dz 
> ho 一 o| (ED)dzE 一 oo 和 全) 


一 Ao0 | 了 CZzyO 7)dZ 一 | 


一 Mo(Ca 一 a) 一 0 
证 毕 . 
现 举例 说 明 如 何 应 用 N-P3 引 理 . 
例 2.1 设 X~NC,l) ,xcEG=(0,2) ,检验 问题 是 : 
末 , :5 一 0 万 :一 2 
给 定 c 一 0. 05, 设 样本 是 Xi ,…X, ,我 们 来 求 出 最 大 功效 的 人 否 
e WU。 


定 域 . 


X 的 密度 范 数 是 
{ 1 .2 | 
三 Z,A) 一 -exp| 一 二 (z 一 人 
VZf 1 
如 把 NI 一 下 昌 | 理 口 条 朱 10 ~ ~ 型 的 不定 城 甘 员 
从 JP 人、 vi]N\LAAA JUN LI 9? 9 人 7 7 八 一 人 人 0j1HJD 人 9? 上 














所 以 C 应 满足 
| - 均 
查 表 知 VC 二 1.65, C 一 - 冯 ,最 大 功效 的 否定 域 是 W， 王 
[人 | ,其 中 =- 工 >) >， 这 个 否定 域 是 由 统 
7 1 一 人 
计量 叉 来 确定 的 . 以 后 将 看 到 ,在 许多 其 他 的 假设 检验 问题 中 也 
有 类 似 情况 ,优良 的 否定 域 往 往 可 以 利用 直观 意义 很 清楚 的 统计 
量 来 确定 


$83 单 参 数 情 形 的 假设 检验 


设 X 的 分 布 末 数 是 F(z,0),0EG@= (ap) ,一 co 委 a<o 委 ce 
这 就 是 单个 实 参数 的 情形 . 在 实际 工作 中 遇 到 的 多 是 下 列 类 型 的 
检验 问题 : 

e。 bb9 。 


(1) 五。 :0<0 < 万。 :0>0， 

(或 瓦 。 :0 过 0 ee> 万 。 :0<0 ) 
(2) 瑟 ,:0E (0 0)e> 万 :0E(00 0 ) 
(3) 万 。:06EL0 0] 一 万 :0EL0 0 


(4 万 ,0 一 0 >F 0>-0O 
\ 让 7/ Li03VU UVI /LasVU UV 


其 中 0 <<0， , 0 和 (a ,D0) ， 0 E (a ,D) ， 


本 节 只 讨论 单 参数 指数 型 分 布 的 检验 问题 . 
定义 3.1 设 X 的 可 能 值 集 合 是 和 称 X 服 从 单 参 


一 上 一 一 上 二 扣 
4 人 4， 布 、 


> - 


这 


恒 


指数 


” 江 
增 


产 必 


的 分 布 密度 (或 概率 郴 数 ) F(z,0) 有 下 列表 达 式 ， 
了 (5 0) 一 SCO) 太 (过 )eQGOY (2) (3. 1] ) 


Am ER 


其 中 gEG@=(a,p) ,SCO>>0,zE%ACz)>>0,Q(CO) 是 0 的 严格 增 函 
数 ( 参 看 第 二 章 例 2. 3)， 


过 


指数 型 分 布 十 分 广泛 ,指数 分 布 、 二 项 分 布 . 负 二 项 分 布 、 
Poisson 分 布 、 均 值 已 知 或 方差 已 知 的 正 态 分 布 等 等 都 是 单 参 数 
为 了 研究 复杂 假设 的 检验 ,我 们 再 对 上 节 例 2.1 考 察 一 下 . 
有 人 可 能 注意 到 ,该 例 里 9= 王 10,2) ,但 导出 的 具有 最 大 功效 的 否 


站 ET 2 一 


定 域 导 "27 无 关 , 即 大 将 @8 变 与 @ 三 40,m) (Ca 0), 则 导出 的 具有 
最 大 功效 的 否定 域 与 -ma 无 关 . 其 原因 是 第 一 类 错误 与 各 无 关 ， 
而 和 的 作用 体现 在 第 二 类 错误 上 , 犯 第 二 类 错误 的 概率 是 1 一 


下 P (又 > 荆 0 
下 V/ 


全 ”0 | 太 
7 


布 困 数 ). 可 以 看 出 ,给 定 2 时 mi 越 大 则 犯 第 二 类 错误 的 概率 越 

小 ;5m 越 小 则 犯 第 二 类 错误 的 概率 越 大 , 即 越 不 易 分 辨 0 与 拓 . 
上 述 事 实 提 示 我 们 ,既然 . 友 , 与 同 无 关 , 例 2.1 中 得 到 的 厂 。 

应 该 是 针对 零 假 设 五 , :w=0 与 备 择 假 设 互 。:w>>0 的 UMP 检验 . 


更 进一步 ,还 可 以 猜想 , 当 检 验 问 题 变 为 : 万 。:p 魏 0 一 歼 。 :1 二 0 时 ， 
允 , 仍 是 UMP 检验 。 下 面 的 定理 3. 1 表明 ,上 述 猜 想 不 仅 是 正确 
的 ,而 且 可 以 由 正 态 分 布 扩展 到 单 参数 指数 型 分 布 的 情形 . 





)=@(1.65 一 人 ae)(@6 是 标准 正 态 分 


为 确定 计 , 以 下 只 讨论 指数 型 分 布 有 密度 Fz,0) 的 情形 ,对 


于 离 藤 型 情形 可 进行 类 似 的 讨论 ，. 


设 XI …,X, 是 样本 ,ziCX，， 


Ze 人 一 一 上 


网 


、 LA 人 1 
时 本 


X ) ， LO 一 T 有 
1 


瓦 。 KE :0 一 四 
十 “CLAN 1 证 存 齐 太 泪 品 
AN vv9L7 9 人 站 1 人 19 人 
P( >,V(CX) > Clp )=a (3. 2) 
] 
则 


3 

ne 
有 
LS 

Se 
量 
AN 
CA 作 
CA 
ccw 


是 检验 水 平 为 a 的 一 臻 最 大 功效 的 否定 域 
证 明 :从 (3. 2 ) 知 请 (入 和 多 0 ) 王 ww. 下 面 证 明 : 对 一 切 一 


一 此 一 < 一 六 人 一 人 


hh ,有 PCXEWo0) 委 cc, 为 此 研究 检验 问题 : 


刀 , :0 一 0c> 末 :0 一 0 (3. 4) 


mm 二 PCOXEW,|b) 


| (zy0O ) 
易 因 4 (0) 


5 D 《0 ) e[Q(b ) 一 &Q(60 站 ve 
6) 


故 WE 
一 《oo 全 Xo } (Z 一 (Zi 办 
根据 N - P 引 理 ,W。 是 检验 问题 (3. 4) 的 水 平 为 mw 的 最 大 功效 的 


7 9T 9 


否定 域 , 根 据 定 理 2..3,W。, 具有 无 但 性 , 即 有 
PCXEWul0) 三 P(OX EWolb)=a 
这 就 证 明了 对 一 切 0 到 0,， 
PCXE 匈 10) 去 
我 们 再 来 证 :对 任何 水 平 不 超过 w 的 否定 域 风 ”, 恒 有 
pow (0)  ow(0) (一 切 0 之 凡 ) 
为 此 ,任意 给 op 


| 0 一 0<> 万 。 0 一 0 (人 3， 5 ) 
d 
也 ho po 一 人 (Z0)/( 交 01) 
易 知 存在 i。 使 得 


1 
过 


( rr < 全 
1 六 人 -一 | 


一 《 妆 5Ao > Mo} 
根据 N-P 引 理 ,W。 是 检验 问题 (3. 5) 的 水 平 为 "a 的 最 大 芒 效 否 
定 域 ,既然 ow (0 ) 委 ac, 故 
Ow 0) 之 Ow(o2 ) 
这 就 证 明了 允 。 是 水 平 为 u 的 一 臻 最 大 功效 (UMP) 否 定 域 . 
证 毕 . 


了 十 二 上 人 TAN- HE 工 了 DT 4 一 3 册 记 二 人 
人 JJ 人 了 AILo 0 之 0 万 。 :0 一 0 HH 过 1 关羽 的 车 药 ， 


现在 应 用 定理 3. 1 研究 正 态 分 布 的 两 个 检验 问题 . 
GD) 设 X~ NGoai)(oo 已 知 ).， 检验 问题 是 
再 :pp 雪 1 :p 一 Aio 
其 中 ALo0 是 已 知 的 . 设 样 本 值 是 过 1 9 ”9 必 n ,如何 检验 厅 。? 














了 站- 寺 
山 .HHJ 
1 
Hz,b) 一 -二 exp( 一 产 (z 一 002 1 
V2Zroo “00 
1 国 攻 2 人 AT | 
全 马 信 Te 汪 e 人 马 信 
2 p1 2 克 | xp 2 pto | 


对 比 (3.1) 知 VCz) 一 z, 依 定理 3. 1 知 一 臻 最 大 功效 的 香 定 域 是 


ER 
其 中 C 满足 
P(>X >Clpo)=a 
有 一 人 一 


7 
故 PU(、 和 X >>Clw) 一 ] Eee 
nm 和” 7/ \ 1 “人 1 
1 8 Co 一 Vaze 
90 | 


C 一 ?UVLo 人 7 V7 
这 时 和 否定 域 (3.6) 可 以 写成 ， 





网 ,一 【人 “9 渤 ) : 这 > 十 二 = | (3. 7 ) 
,所 了 7 / 
例 3.1 根据 长 期 的 经 验 和 资料 表明 , 茶 砖 瓦 厂 所 生产 砖 的 


“ 抗 断 强度 "X 服从 正 态 分 布 , 方 差 o 三 1.21, 今 从 该 厂 所 生产 的 


32. 56 ,29.66,31. 64,30.00,31. 87 ,31. 03 
问 :这 一 批 砖 的 平均 抗 断 强度 可 否认 为 超过 30? 
设 X 一 NGo DY 已 知 交 =1.21, 检 验 问 题 是 


玉 。 :Ap 委 30 二 万 :0 二 30 
设 v= 王 0. 05 ,现在 "= 一 6,m 王 30,o 王 1.1, 从 (3.7) 知 否定 域 为 
Wu 一 {((zi，…z):Zz 盖 30.74)} 


CD 
4 


现在 根据 所 给 的 样本 值 32. 56,…,31. 03 计算 出 二 = 一 31. 3 二 
30. 74, 故 样本 值 落 入 了 否定 域 ,因而 应 否定 瑟 , :ws 委 30, 所 以 可 以 
认为 这 批 砖 的 平均 抗 断 强度 超过 30. 

设 X 一 NG 天 )(Coo 已 知 ), 设 样本 值 是 zi … zy 人 研究 


万 。 :0 < 委 co 人 万 。 :0” 全 0 





入 时 竹 虔 了 罗 妇 和 古 
Fr 2) 一 - eX (二 )2 
由 万- exP1 77 | 
AAA LTG 汉 / 


对 比 (3.1) 知 V(z) 三 (Z 一 pm 并 ,从 定理 3. 1 知 一 臻 最 大 功效 的 否 
定 域 是 


Wu 一 (zi Te) > (Zi 一 po 二 六 C) 
1 
其 中 C 满足 


DAN NI、 mi 2NV_ 
4 从 六 FE0 7/ -一 ~、 人 1I0 妇 
z 一 ] 
1] 到 ? 
但 太一 Ch 时 ,一 NS 《和 友 一 ,2 恨 从 个 白 由 肛 负 了 布 . 利 | 
- We 人 人 人 7 7 AAA 和 上 人 大 区 Eee 7 


二 也 必 ”- 


用 X 分 布 的 分 位 数 表 不 难 找 出 C 采 . 
对 于 本 节 开 始 提出 的 假设 检验 问题 2) .3) .4) ,经 过 现代 的 深 


和 7 LA 5 一 [LA 人 了 一 有 


人 人 研 完 ,指数 型 分 布 情形 已 经 完全 解决 了 , 见 下 列 三 个 定理 . 由 于 


这 些 定 理 的 数学 证 明 较 长 稚 人 们 忱 在 本寺 十 尼 
一 人 L 十 朋 [JTJTTL TAR 


叙述 证 明 , 供 有 兴趣 的 读者 参考 . 


一 
人 JIE 以 个 月 刀 人 作证 及 


xzO) 一 SG) 大 (ZJ)ee 
这 里 SO) 二 0,AZz) 志 0,QCO) 是 0 的 严格 增 晒 数 . 
给 定 检 验 问 题 : 
厅 ,:0 E(0 0) 二 五。:0 EC0 0:) 
这 入 一 (X: ,…X,) 是 X 的 样本 , 且 


a。 站 
7 


小 


多 一 ( (zi 0 < > VCzi) <、 C: } 


1 一 ] 


岂 人 Ce RATTRARTIE ACTA 
中 直入 证 
定理 3.3 设 


LA 人 rz 上 人 TI 日 
2 AL 11 人 | 
万 。 :OE | 0 0， | 二 万 :0OE10 0 
(a<<0<0 <0) 


人 一 er tt 让 Hp 人 


看 Ci;<C;* 使 得 
忆 ( 代 持 克 。0) 王 cc (一 1，2) 《3. 8) 

则 W。 是 水 平 为 wa 的 一 臻 最 大 功效 的 无 侦 否 定 域 (UMPU 检验 )， 

定理 3.4 设 X 有 分 布 密度 

Fr,g) 一 SCO) 太 (并 )eQOvG 

这 里 OE (aa,p) (一 co 和 受 ac<o 委 co),SC0) >0,ACz) 志 0,Q 0) >>0， 

给 定 检 验 问 题 

HH :0 一 0 -> 甩 :0b (bpE(ayb)) 


3 vv ,rr 目 在 本 rr vv NT 日 
以 饼 NE ?An 7 十 1T 人 9 1 9 -ii /7 2 -Li -L 
i 一 1 
Wo 一 (人 (zi TtCZ)<C 或 C， } 
区 人 <- 一方 个 很 
和 1 一、 全 可 
忆 ( 人 GE 克 0 7) 一 a (3. 9 ) 
尼 。 (Tvw。 《全 ) 大 入)) 一 aEo 大 从) (3， 10 ) 


(CEo。 万 是 对 应 0=0% 时 的 数学 期 望 ). 
则 W, 是 水 平 为 的 一 臻 最 大 功效 无 偏 否定 域 (UMPU 检验 )， 
条 伴 k3.10) 什么 时 候 得 到 满足 昵 ? 我 们 指出 ， 若 区 X) 一 


> VCX) 的 分 布 关于 某 个 数 m, 是 对 称 的 , 妈 


PC <r 一 al0)=PGY>rm 十 ap) (一 切 a 过 0) 
避 TW 一 (了 .frKC7， 小 于 六 一 C 珍 老 关于 天 小 CA 人 涝 中 PUONXCU | 
YY IO SN\ 访 7 7 一 -人 下 光 [A 人 人 - 70 1 vv A 人 -人 和 ”01 


0 ) 人 10) 一 和 定 成 立 . 实际 上 ,此 时 有 


下 开 Arsao)dz 


Wo 一] 


(fs 起 二 刘 二 人 12) 


| (1 一 ra 二 C) 





一 0 十 roa 
由 于 BE (一 mm) 一 0, 故 已 (CIw (X)tCX)) 一 wE t 这 表明 条 件 
(3.-10) 成 立 

例 3.2 设 zi,……，,z, 是 来 自 N(0,o) 的 样本 ,oo 已 知 ;， 研 究 检 
验 问 题 

万 , :0 = 0 万 :0 所 0 
六 和 让 站 
Too 





对 比 (3. 1) 知 VC(z)=z, 故 从 定理 3. 4 知 一 臻 最 大 功效 无 偏 否 和 定 
域 是 : 

Wo 一 (zz Ri C 或 过 C? | 
这 与 直观 是 一 致 的 ,其 中 (人 1，(: 满足 : 


。 站 挛 本 
电 ec OO 宣 


P( 并 < G; 或 >Czlp) 一 na 


> 


(mm (2 X) 一 ( 安 2 (3.11) 


ss Nbnoi ,> 的 分 布 天 于 7 一 20。 征 对 
称 的 , 故 只 要 取 C > 0,CI 王 20o 一 CCLz 一 10 十 C 使 得 











P(> Xi<C 或 之 Cslb) 一 na (3. 12) 
i 一 1 
ra 11\_ er pe 
只 4\D.。IL/ 一 征 / 有 凡人 
从 (3. 12) 
一 P(| >)X 一 1200 > Clp ) 
-az( 让 ) 
人 /1zar。 
于 是 
一 C 
7LG0 


这 里 是 标准 正 态 分 布 的 了 分 位 数 ,满足 





e dx 一 一 
.一 V2T 尼 


所 以 
(> 一 一 V72 aozs 


一 一 


山 


Wo 一 (人 (Cz) > 一 100 meom) 


(因为 六 
例 3.3 设 X，…,X, 是 来 自 N(0,ci ) 的 样本 (Co 已 知 ) ,研究 


ee OO7 。 


&A 


检验 问题 : 
1 :0 人 | 0 ,0 j] 二 万。 :0 EL ,0 
从 定理 3. 3 知 , 一 臻 最 大 功效 无 偏 否 定 域 是 ， 
风 ,一 { (zi 9 “”“” 交 交 ) 。 SS 或 人 (CC? 


这 里 CC: 满足 


Dr  。。。AwN\ 一 TI 10N 一 ”一 1 9 
4 NANWZA1L 9? 9 人 mn/ NS YY0OIUI7 一 CC \L -上 9 二 7/ 
即 有 
(人 701 C1 一 70 
人 上 6 二 天 =1 一 。 
WV7za， ， V7zr 
下 (所 二 2 | 一 [二 二 2 | 
一 一 一 1 一 1 一 v 
Vzacn / V7za / 


CC: 需 通过 正 态 分 布 表 多 次 试 查 才能 找 出 近似 值 . 
当 如 三 一 六 时 , 必 有 C 三 一 Ci ,此 时 Cl 利用 正 态 分 布 表 较 易 
求 出 . 
为 了 给 出 定理 3.2, 定 理 3. 3 和 定理 3. 4 的 数学 证 明 , 我 们 首先 要 推广 
-了 引 理 . 
引 理 3.1(CN-P 引 理 的 推广 ) 设 A(Cz)y, PCz)y PCz)y，gz)，g (zz)， 
z) 都 是 S 上 的 可 积 函 数 (S 是 z” 维 空间 中 的 区 域 或 为 更 一 般 的 集合 ),0 委 


8 (过 )<<] 0<<&(r < 一 1 ON< 一 Ar < 一 1 , 则 有 下 列 结论 :; 


~ 上 mL] mL 9 人 人 人 吃 ] 一 全 二 ] JJ 一 上 YL 。 


(1) 知 
| rdaz=| 访 dz 《一 1,2) (3. 13) 


f1， 当 户 (z) > > 开户 (z) 


y Wi] 
0， 当 户 (z) < > Ki; 大 (z) 
这 里 天 ; ,天 ， 是 常数 , 则 
| 全 六 dz>| gjodz (3. 14) 


\D 
Wo 


(2) 若 | 8H,dz 一 | rdz (一 1,2) 
人 当 请 (z) < > ,天 , 记 (zz) 


由) 一 
攻 当 广 (z) > 开矿 (z) 
这 里 Ki ,K, 是 常数 , 则 
| 87odz< | srodz 3， 15) 
(3) 在 (3. 13) 中 “一 ”号 换 成 “ 委 ?” 号 ,又 天: 0, 开 :过 0, 则 (3. 14) 仍 然 
成 立 . 
证 明 :不 难看 出 
(8 一 ( 户 一 > Ki 太 )0 
于 是 
| 一 凡 ( 户 一 >K7 )dz>0 
所 以 
| 一 Pdz>> 六 一 凡 Adz=0 (3. 16) 
从 而 
| 入 Pdz>| rodz 


oj ~ = 


这 就 证 明了 (3. 14). 从 (3. 16) 看 , 若 在 (3. 13) 中 “三 ” 换 成 “< 委 ”, 又 开 , 辫 0( 一 
1,2), 则 (3. 14) 仍 成 立 . 
从 (% 一 归 ( 户 一 > K: 记 ) 委 0 不 难 推出 (3. 15) 成 立 . 
证 毕 . 
定理 3. 2 的 证 明 :我 们 首先 指出 ,对 一 切 84<0 及 加 >>0 均 有 
PCXE Wo|0) 入 n (3. 17) 
为 确定 计 ,不 妨 设 %<b ( 当 2 >0 时 可 进行 类 似 的 讨论 ), 记 方 (z) = 


TI rz 6). 我 们 指出 , 必 存 在 天 ,K: 使 得 


多 ,二 (z:C; < Se << C2> } 
1 


2 
本 (zz) << 之 /Ki 六 (z) ) 
实际 上 ， 
2 
{ 工 : 户 ( 式 ) << > 天, 六 (z) } 
1 


们 二 2 本 
{( 郊 :S"(b ) et 2v0， 二 > ， 开 ,S"(g )e904) 之 Ye } 


一 (zi:1 < 忆 ) ( 工 一 (21 人 
j =1 


这 里 


0j 一 长; 





| 人 (3. 18) 








行列 式 
eol C1 eb2 Cl 
号 el cz2 eei 好 C2 
一 cttcl [ed-)Cc-c 1] 之 0 
于 是 有 解 


Q1 二 元 (ezc 一 ec ) >0 


(elb151 eolC2 ) < 一 0 


必 | 一 


公 2 -一 


| 
冲 
下 
人 压 


< 


2 
(1 < > oje 小 一 《te “1: 一 Qoeto2 ii < 一 | 》 
1 
但 范 数 e :一 aze 是 上 的 严格 凸 函 数 , 故 
RS RAR 
1 < 之 /0je7y /一 ((L1 (2 ) 
1 


二 
计 


< UI TI 工 一 站 了 了 上, TI T~ ” -- 
中 LDO LI 9 LA2 ? 碟 人 /JU LEI LAA2 9 月 


{z: 户 (z) < Dj 


和 
人 外 Ta | Ta | 已 
令 
( 工 ， 当 Z 生 外。 
4 一 | 加 
0 ， 2 ZE 儿 。 
风 Z)=a 
注意 
|&z7 (Zz)dz 一 wa 一 “一 |? (Z)dz 
(7 一 1] 2) 从 已 | 了 3 2 1 4n 
Vi 上 9227。AMN 了 TI 二 .上 
PCXEW,|p6) 一 |8Cz)ACz)dz 


| 

j 
< 委 |&z) PCz)dz 一 wa 
这 就 证 明了 (3. 17). 


下 面 证 明 对 任 人 不 夫 WU 口 本 渤 全 PCUWIN < rt 0 一 (0 
HU UL JJ 9 JJ 工 | 呈 全 了 二 人 入 苹 近 口 人 7 ww7 以 2 UNUL ?9 
P(XEWo|10) 过 PCOXE 砚 |10) (00E(C0 0)) (3. 19) 
任意 固定 E (0 0 ), 仍 记 2 
下 门 愉 YY 门店 4AN 
Ji 六 [一 外 /人 7 一 上 29 9 二 / 
;一 ] 
2 
Wo 一 1Z: 户 (Z) 全 > 有 万 (Zz) } (3. 20) 
j =1 
实际 上 


(zz: 记 (Z) 盖 > 有 ii 广 (Z) 
J 一 1 





-1z1> 袜 机 ( 号 的) ep 人 [ac) 一 ado]2 vcn)) | 
一 (人 zZ:1 过 > ae ) 


这 里 


pb 一 QGCO 1) 一 QCO: ) < 0 
p; 一 QCO2 ) 和 CO ) 盖 0 


天 SO) 
和 一 人 束 SO vcz) 


与 前 面 的 论证 类 似 , 知 可 取 a1 之 0，as 一 0 使 得 


2 2 
1] 一 > aj ecl 一 > je5C2 
】 


因 >oew 是 : 的 严格 凸 上 因数 ， 


0,a > 盖 0 知 有 天, >0, 氏 ,二 0 使 得 (3. 20) 成 立 
取 光一 Tw ，g% 一 ww( 示 性 函数 ), 则 
站 广 dz 一 POXE 丽 ,|0)=a 
>> PCGXE 砚 16) 一 | 籽 dz  《G 一 12) 
根据 引 理 3. 1 知 
| 四 Paz| rodz 


即 有 P(XEWo1b) 之 P(XE 丽 10), 这 就 证 明了 (3. 19) 


只 须 证 明 对 一 切 wE (0 ,207 有 
PCXEWo|H) 委 na (3. 21) 
雹 


定理 3. 3 的 证 明 : 为 了 证 W。 的 水 平 是 a， 


广 (Z) 一 TT rz en (7 一 1 
我 们 指出 存在 天 ,天 : 使 得 


一] 
竹 


| 
(> 
放 


2 
允 一 (zz) < > 有) 广 (z) ) (3. 22) 
1 
实际 上 


2 区 
(z:(z) < 配方 (Z} 一 (ZI1< ae )} 
1 1 





这 里 
站 一 QC0) 一 Q40) 一 0 
六 一 Q(b JE CC0 ) 二 0 
| SG40) 
2 
Lv 一 、v37 
< 
! 一 人 YAZi 7/ 
解 方程 组 


2 2 
攻 一 > 0 ec1 一 > 0 e 刀 5C2 
1 】 


可 求 得 al > 0,az > 0, 从 而 可 确定 出 多, > 0,K: > 0. 由 于 > ,ae 好 是 :的 
严格 凸 函 数 , 故 


2 
| \N、 6 rr  、 mm、 Y 二 
1 > 10jej 一 《一 c9 LI) UL2 yc2e 1) 
1 


取 gz)=a (Zz) ,从 引 理 3. 1 知 
即 有 P(XEWol0) 委 ,这 就 证 明了 (3. 21). 
为 了 证 明 克 。 的 无 偶 性 ,我 们 衣 先 指出 对 一 切 ELb ,0 ], 必 人 存在 天:， 
开 : 使 得 
W,={z:P(z)> > 有 万 (Z) } (3. 23) 
不 芒 设 8>b# ( 当 负 二 0 时 可 作 类 似 的 论证 ), 显 然 


2 
{ : 《并 ) 一 > 三 必 工 ) 一 ( 工 :] 之 > die ) 
1 


WA 上 4 \ 


这 里 


d d 
记 一 QC0) 一 Q(Gb) 一 天 一 Q(0) 一 Q40) 一 0 


0 
wu 一 天 | 坟 人 





人 


上 一 > VCzi) 
1 


解 方程 组 


2 2 
| > je55l -一 ai e 包 5C2 
1 ] 


可 求 出 al ,as 且 al<0,az 盖 0, 从 而 可 求 出 开 ; ,天 ，. 
了 
{ 革 和 慰 、 


2 
(t:1 > > je ) 一 {t:az <<e 2 一 Ge 2 ) 
1 


但 ez 一 六 et 一 5) 县 .7 和 NE 术 
1 一 二 4 二 AL 人 


凸 函数 , 故 
交 A 了 了 人 


量 


， 2 
(t1> >oez 一 (一 co CI) U (CC co) 
] 


所 以 (3. 23) 成 立 . 
AR tt 一 了 7 N JI- 站 
子 9? 一 4WN\Z) 9 则 


从 (3. 23) 和 引 理 3. 1 知 


[4 [br 1 
由 


即 有 P(XE op) 志 ec。 这 就 证 明了 W。 是 水 平 为 we 的 无 偏 否 定 域 . 
设 太 是 水 平 为 ec 的 任何 无 偏 否定 域 , 我 们 来 证 明 : 对 一 切 %ELb ,2 ] 有 


P(XEW。o|6) 之 P(GXE 肌 |0:) (3. 24) 
实际 上 PC(CXE 砚 10) 
一 | S"(g) ITaczpempfQco >vcz } dz 
既然 假设 Q(g) 是 连续 函数 , 易 知 PCXE 仙 10) 也 是 6 的 连续 函数 ,根据 无 偏 


四 了 六 4《 三 
0 


性 ,P(XE 克 10) 记 ca( 一 切 OELp ,0 ]) 利用 连续 性 知 


生 可 到 | C oo 


了 PRE 有 100) 志 ww (一 1;2) 
另 一 方面 , 风 的 水 平 是 c, 从 而 
P(X E 多 |0) 一 wa (Ci 一 1,2) 
仍 记 一 Tw , 令 9 一 Jr , 则 


他 太 dz 一 P(zEW。 0 )== a 


村 
一 了 (E 克 10) 一 18/ 六 dz 一 1 2) 


m 


利用 (3. 23) 和 引 理 3. 1 知 
| 因 户 4z 人 jzradz 
即 


P(XEW，|0) 之 P(CXE WO 
旺 所 L 王 本 AZ 一 一 所 大 


覃 届 上 立 


故 (3. 24) 成 立 . 这 就 证 明了 丸 。 是 一 致 最 大 功效 无 偏 否 定 域 . 


定理 3.4 的 证 明 : 任 给 定 六 bo, 令 
广 (z) 一 LCzyg) 一 | (2 0 ) 
1 
了 2 《Z) 一 二 (Zyo ) 恩 并) 
Js(Z) 一 二 (ZO ) 
我 们 指出 , 必 存 在 Ki ,K。 使 得 
2 
Wu 一 {z:P(z)>>> 有 万 (z)) (3. 25) 
1 


实际 上 


{z > 症 Na)}- (zex 刀 一 al 一 astZz) 之 0) 


这 里 
0 一 Q(0 ) 一 QCO) 
及 ,| 站 (7 一 1,2) 
SGO) 
解 方程 


eic1 一 .QI1 一 Qaz Cl 二 一 4Q1 一 CoCL; 一 0 
对 给 定 的 Ci,C: ,可 求 出 al ,az ,从 而 可 确定 开 ,K: ,由 于 时 一 al 一 at 是 上 的 
严格 凸 函 数 , 知 

{tse 一 Cl 一 0 人 0) 一 (一 coyCli) 
所 以 
2 

{(: 户 (z) 2 人 > 本) 方 (Z) } 一 (工区 并 ) < Ci ,或 盖 Co 一人。 
1 


即 (3. 25) 成 立 . 


2 一 ”口上 


为 了 证 明 太 。 的 无 偏 : 
P(XEWo|6) 三 wa (0 六 bo) (3. 26) 
令 央 一 Lvw。 (Zz) ,ga, 昂 寺 

作 万 dz 一 PP(A E 人 | 6 ) 一 aQ 一 |9ridz 


他 户 dZz 一 下 6 LTw。 (XD)ECXD) 有 aoP。 盯 信 ) 一 |grdz 
(这 里 用 了 条 件 (3. Ce Rs 1 知 


即 P(XE W。 26). 
设 历 是 水 平 为 ac 的 任 一 无 偏 否定 域 , 我 们 来 证 :对 一 切 和 六 bm 有 


P(XEWo|p) 之 PCOXE 砚 |0)) (3. 27) 
为 此 .我们 首先 撕 中 
AAA TIJ DAJSB LO 
FE (Jw(CX)ICX)) 一 aoE。 EX) (3. 28) 
今 
CO) 一 | T FCzi 0)dz 


/0 ) 一 P(XE 砚 |0) 一 a 


根据 太 的 无 偏 性 0%(0)c=W0) (一 切 0) ,所 以 WO0) 在 4 达 最 小 值 , 从 


IAAVnAN_ An 
站 Woo 7 一 忆 
但 是 


wb)=C(o)| TIaz)eeoedz 
| 唱 
(CCO) 一 [SCO)]") 





于 是 
y(O)=CCg| TTACri)eeexadz 十 
JWw- 了 二 
cb)| TIAz)eeoeerz)Q'Co)dz 
礁 人 人 一 w- 
_ CO PirwCa 十 QrCOBLTCOECZ) 
CO 和 
但 
1== | co) ITecz ) eco dz 
两 边 微 商 知 
0 一 交 ( 名 十 QCO)EN() 
C(0) 


从 必 (2) 王 0, 推 知 
一 Q (6)Eotiva 十 Q (Co)Eo LI 。 菇 一 0 


三 
J JEANVD。2cCO7/ 有 ALA。 
仍 令 央 一 Tw ,又 令 9 一 Tw , 则 
| 六 dz 一 PCOXEW。lp%w)= 三 ac=POXE 画 |0) = 
人 7Y32 2RNAn 
AN。 coO/ 几 
| 4 了 了 一 -及 TTJT (XI | 
由 vJj 2 ~ 人 00 


一 acEi zt(X) 一 加, [Tw (XD)z()] 


利用 (3. 25) 及 引 理 3. 1 知 
作 天 > |77:dz 


即 
PCXEWolp) 二 PCXE 人 了 |0) 


|8 1 dz 


这 驶 证 明了 (3. 27). 


并 
区 


内 


义 似 然 比 检 


上 一 节 处 理 问 题 虽 很 圆满 ,但 所 讨论 的 情况 太 特 殊 ,对 总 体 的 


概 放 分 在 在 很 可 的 限 抽 | 许 包 党 四 的 检验 问题 就 对 付 不 了 . 本 节 
号 奶 人 镍 有 有 4 慌 十 乓 也 病 9， 让 和 前 克己 开罗 较 锁 辣 人 小 


介绍 一 种 检验 法 , 它 适 用 的 范围 极 广 , 当 样 本 量 ” 较 大 时 ,否定 域 


HH Me Ar HHAA 一 站 全、 中 CA Jr 这 1LT 人 > 一 一 rz 四 人 
往往 相当 好 ( 即 第 二 尖 钳 放 的 梳 率 比较 小 ) , 里 然 已 小 一 自 征 一 芭 


最 大 功效 的 . 多 数 情 况 下 可 以 证 明 lim pow。 (0) 王 1( 对 一 切 6E 9 )， 


叫 


这 里 豆 .:0OE 8@, 是 备 择 假设 ,ow (b) 是 参数 真 值 是 0 时 检验 法 W。 


十 一” 户 户 和 用 1 v 门 了 mr 一 2》 


护 乞 令 修 风 人 司 举 ， 
灵 % 的 分 布 密度 是 Anal ,6.)EBCR”( 对 离散 
型 分 布 可 进行 类 似 的 讨论 


4 帮 同上 且 有 的 站 2 直子 储 研究 检验 问题 
及 必 o 征 电 有 站 公有 基本 琵 ， 切 | < 


朵 。: os> 凡 :0O6C 一 b 


志 





1 


定义 4.1 称 





是 真 的 ， 则 2 的 最 大 似 然 舍 讨 


显然 人 (z) 之 1 ,直观 上 看 ,各 万 。 
和 ( 浆 ) ) 应 该 接近 于 1 反之 , 若 1(Z) 的 值 


应 该 很 大 可 能 属于 @。 ,从 而 、， 


太 大 就 应 该 否定 互 。 Eee 必 取 否定 域 
一 {《 妆 :AZC) 盖 Ao) (4. ] ) 
其 中 满足 
P(XEWol0) 一 a (4. 2) 


这 里 wa 是 预先 给 定 的 检验 水 平 (0 一 一 1) 


之 二 QQ& 和 二 JJLERAC 有 JJ 和 一 全 -一人 


这 样 的 检验 法 叫做 广义 似 然 比 检验 法 ,简称 似 然 比 检验 法 . 
这 个 方法 在 许多 情形 下 常 可 导出 有 实用 价值 的 具体 否定 域 . 在 使 
用 广义 似 然 比 检验 法 时 ,关键 在 于 能 和 否 找 出 1。 满 足 (4. 2). 

我 们 指出 ,广义 似 然 比 是 充分 统计 量 的 郴 数 ,从 而 否定 域 
(4.1) 常 常 是 由 充分 统计 量 来 确定 . 实际 上 ,者 p(X) 是 充分 统计 
量 ( 可 以 是 回 量 ), 则 有 工 (z,0) 一 gLp(Z) ,0 。 凡 CC)， 从 而 


Sup SLCZ) ,0 
人 AZ) 一 一 -一 一 一 一 一 L 
六 人 gLo( 蕊 )， 站 人 


呈 


所 以 否定 域 
太一 人 Zz:ACZ) 盖 Mo) 一 人 :PCZ)E 有) 

这 里 吕 是 适当 的 集合 ' 

由 于 正 态 总 体 在 实际 工作 中 最 常见 ,数学 处 理 上 也 比较 成 熟 ， 
下 面 讨论 正 态 总 体 的 各 种 检验 问题 . 

(1) 设 X~NCr co 已 知 ,wUEG@ 一 (一 ceo,co) 考 虑 检验 
问题 : 
末 。 :Ap 一 A 全 万 :ASH 

给 定 一 0. 05 ,样本 是 Xi ，…,X， 如 何 检验 五 。? 

这 个 检验 问题 已 在 $ 3 中 解决 了 ,现在 用 广义 似 然 比 检验 法 
来 试 一 试 . 


了 (zy) 一 人 ( 二 (zx 一 0 


| 
> 
AD 





二 ) exp (- 三 [(r 一 二 十 nEO]) 


/ 


因 为 @ 一 《po , 易 知 L(eo) 王 LOzyuo)， 
LO)= (元 ) 加 元 二 2 一 工 ) )， 


于 是 广义 似 然 比 4 一 e 太 5 ,可 见 否定 域 
II 本 二 太一 me| > (C) 
其 中 C 满足 


了 7 本 人 


有 | 有 二 | 


因为 & 一 和 时 , 吧 ( 又 一 mm) 一 NC0,1) , 故 利用 正 态 分 布 表 知 C 一 





寺 "这 样 得 到 的 否定 域 与 83 中 获得 的 否定 域 是 一 致 的 ,从 
3 中 知 它 是 一 臻 最 大 功效 无 偏 的 . 
(2) 设 X 一 No 9 三 (0) :一 co<p<co, 0 二 和 < 二 co)， 
方差 oc 未 知 , 检 验 问 题 是 : 
互 。 :人 一 /lot 万 。 7 本 
这 类 问题 在 实际 工作 中 更 常见 ,》1 中 例 1.2 即 是 一 例 . 
我 们 用 广义 似 然 比 检 验 法 虹 出 合适 的 否定 域 . 记 Bu = 人 (Cupo， 


AN 册 亡 一 


0 ):0 >0}), 设 Z=(z，…z) 是 样本 天 一 (XI 和 …X。) 的 值 . z 的 


似 然 郴 数 
LCzy0) 一 (去 ) em 全- 二 > 一 AD) | 


现 ) sp 人 -而 [e 一 工 ): 十 za 一 J 人 | 


太 0 一 
W 到 ViLA 








(9-=(wio2))， 易 知 


L(b) 一 sup 工 (和 0) 一 一 二 人工 一 一 0 
0 一 工 )2 | 


| 
| 
人 > 


卫 
7 2 一 


Fo) 一 2 LAZzy0O) 一 和 e 


[3x 2， (Zi 一 po ) )2 | 


rs|a 








人 
] L 
三 三 | 
2 
| 
】 所 
其 中 


Se 一 工 ) 


显然 是 工 的 严格 增 函 数 , 故 广义 似 然 比 检验 的 否定 域 为 : 


太一 ((Zl 并 ) | 全 | C) (4. 4) 
其 中 C 适合 
PP( 和 EWol (oo)) 一 oa (一 切 I) 
-一 -2 帮 m .EL HS LI 7 一 ] 人 、D 四 rrH FFE WA LA 十 信 
从 第 二 一 时 仙人 ”ALo 时 , 统 讨 量 开 服从 > 广 昌 国有 肥 0 人 人 市 ， 凡 


(4.4) 中 的 C 可 从 : ee 例如 2 一 10 时 ,自由 度 为 9， 


Je me 


aa 一 0.05 有 时 奉 出 C 一 2. 262. 
否定 域 (4、 4) 有 何人 优良 性 昵 ? 可 以 证 明 它 是 一 臻 最 大 功效 无 


偏 的 否定 域 . 证 明 过 程 较 复杂 ,超出 了 本 书 范围 . 读者 如 有 兴趣 ， 


HT 做 委 六 献 |12 | 
J 了 由 和 人 入 队 L- 2 DJ 


例 4.1 用 某 仪 右 间接 测 量 茶 物质 的 温度 (人 ), 测 5 次 ,数据 


人 站 严 一 


1 250，1 20o,124o,1260,127o ,而 用 别 的 精确 方法 得 到 温度 的 
为 1277( 可 看 作 真 值 )， 问 该 仪 有 无 系统 偏差 


SU 站 “号 wAp 


由 于 测量 值 一 般 服 从 正 态 分 布 六 )， 这 个 问题 就 是 检验 


(日 天 -关上 日 寸 Anm JJH JR LT HH meHO DR Cr 上 上 
”| 一 人 E/ 岂 二 和 丘 人 个 首 中 J， 1 史 下 的 ， 中 央 侍 年 堪 
| 要 松 


Wo 一 《(CZl，…，Zs) 


石和 


7 


2. 776. 故 
夯 ,一 ({(Czl zs5) :| 开 | 盖 2.776) 
根据 所 给 的 样本 值 , 计 算得 | 开 | 三 过 2 776 , 故 应 否定 五 ,. 


换 句 话说 ,该 仪器 测 温 有 系统 偏差 . 
(3 ) 仅 及 一 NOo 0 未 知 9 之 1 9 ”” ”9 必 mn 是 样本 值 , 对 于 检 


了 AAA 


.已 


攻 


厅 。:1 委 moe 及: 之 Ano 
Ta JJ 号 人 一 “ 到 。 


五 


也 


六 修 | 
-ww 


/ 1 人 


以 然 比 


YX2 


月 检验 
内 一 (人 (zl : 下 过 CI) (4. 5) 
其 中 了 的 表达 式 见 (4. 3) ,C 由 方程 


| 上 ICy)dy 一 wa 
ec 
确定 ,这 里 zx-;(?) 是 > 一 1 个 自由 度 的 :分布 的 分 布 密度 .Ci 可 
查 表 得 到 . 
否定 域 (4. 5) 在 直观 上 甚 为 合理 数学 上 可 以 证 明 , 它 是 一 至 


最 大 功效 无 但 的 会 则 人 立 走 [12 | 
< 以 [人 八 - 人 ALTURY 2 AL 和 及 \L- 2 了 ， 


类 伏地 ,对 于 检验 问题 : 
人 : /L -一 之 po 万 。 : < /ALo 


可 用 广义 似 然 人 


症 
Ar 
3 
一 
上 收 
C)> 
\ew 


( 


C: 可 查分 布 表 得 到 . 可 以 证 明和 否定 域 (4 6) 也 是 一 臻 最 大 功效 
无 候 的 . 
(4) 设 X~NC 六 ) ,未 知 , 考 虑 检验 问题 : 


互 。 :0 二 00 万 。 :0 所 a0 
给 定 aE(0,1), 衣 样本 么 = 王 (Ai ,XXX,) 的 值 是 Ai ，。。 


了 0 
LC  ” 


图 
人 


z,). 利用 广义 似 然 比 检验 法 可 导出 否定 域 为 


人 W, 一 (人 (zz):UL DC 或 二 CI) 《4. 7 ) 
其 中 
w 一 二 (zi 一元) (4. 8) 
Go 1 
LI << (Cs? 满足 : 
上 (入 E 几 。 | woo ) 一 a (4. 9 ) 
可 以 证 明 , 在 万 。 成 立 的 条 件 下 下 一 XGAI，…， 入 ，。) 服从 7 一 个 目 
由 度 的 X 分 布 . (4. 9) 等 价 于 
| 部 
| 后 一 1 (dy 十 | pg ICy)dy 一 Q (4. 10 1) 


这 里 g,(y) 是 个 自由 度 的 X 分 布 的 分 布 密度 . 


f、 一 TI 口 革 


否定 域 (4.7) 在 直观 上 甚 为 合理 . 数学 上 可 以 证 明 ,如果 C)， 


C; 满足 (4. 10) 及 


和 grH(y)dy 一 1 一 a 


4 7 有 目 _ .Wi 有 则 下 TAN 二 人 Ba 丰 全 
芋 。( 7/ 人 E 二 JE A 八 -AAA NURYV。 


J UN 
在 实用 上 稼 取 Ci < 反 C: ,满足 
攻 w li(y)dy 一 六 


As 
性 
分 
jw 
| 亚 。 
\c 


这 样 的 C, ,C;, 可 通过 查 X 分 布 表 很 易 得 到 . 
例 4.2 某 车 间 生 产 铜 丝 ,生产 一 向 比较 稳定 . 人 
便 抽 到 10 根 检 查 其 折 斯 力 , 得 数据 如 下 : 
578,512,570,568,572,570,570,572,596 ,654 
问 :是 否 可 相信 该 车 间 的 钢丝 的 折 世 力 的 方差 为 64? 


用 X 表示 铜 丝 的 折断 力 , 可 以 认为 X~-NCoyo 我们 的 任 
/和 人 [有 JJ 一 HRV YAUIAAV 人 人 \F， ?ww 7 。， JJHJ 


务 是 根据 样本 值 尼 1 9 ””” ,io 来 检验 假设 万 , : 一 04. 


根据 上 面 所 讲 的 ,应 取 和 否定 域 
W 一 ((zl…Zzlio): < Cl 或 (z } 


10 
其 中 w 一 二 (7 一 区 ). 
04 乞 


几 六 一 上 -一 上 


给 定 一 0.05, 从 X 分 布 表 查 得 C = 一 19.0 满足 (4. 11). 
根据 所 了 听 给 的 样本 值 二 0105 5D84， 算 和 & 一 0. 05. 由 
于 2.70<<10.65<19. 0 , 故 观 察 到 的 样本 未 落 人 否定 域 , 从 而 应 接 


《3 人 TFT 1 一 64 
-ED DC 0 WU 工 。 


(5) 设 一 NGCxoo )， 人 研究 检验 问题 : 
瑟 ， 8 < 0 五 。 :0 相 00 


用 广义 似 然 比 检验 法 导出 的 否定 域 是 


风 , 王 ((Cz ZN) :DC (4. 12 ) 
甘 巾 的 去 汰 陈刚 (4 R) 洼 
AN we AL 


| 人 | (y) dy 一 CQ 
(2 


这 里 g，;(y) 是 ”一 1 个 自由 度 的 X 分 布 的 密度 . 数学 上 可 以 证 明 


在 这 所 (4 12》 且 _ 确 电 上 功放 天 偏 的 
中 所. 二 7 起 一 庆 取 和 八 妃 人 刀 AM 负 昌 


类 仅 地 ,对 于 检验 问题 
万 , :co oo 二 万 :< cl 
用 广义 似 然 比 检验 法 导出 的 否定 域 是 
W 一 (zl 和 zz):< CI) (4. 13) 
其 中 zx 的 表达 式 见 (4. 8),C1 满足 


工人 一 人 (uaz ya2 )， 人 入 的 杆 本 是 入 二 〈《 久 1， ， 从。 ) 了 
(YY。) ,我 们 设 两 个 样本 相互 独立 ,研究 下 列 检验 问题 


给 定 <cE (0,1) ,利用 广义 似 然 比 检验 法 可 导出 否定 域 是 
几 一 ((zi ?” “9 雹 站 ”y1 9?” 9 .yny ) :上 < 人 或 这 CC ) 〈4. 14) 
其 中 


2 一 并 ) /7 ] ) 
F = 二 -一 一 (4. 15) 
> (yy 一 y)2 /Cr 人 ] ) 
] 


并 一 7 一 二 >)y 
怎样 确定 Cl,C: 使 得 泵 。 的 检验 水 平 是 给 定 的 c 呢 ? 这 就 需 
要 全 究 统计 量 下 (将 zy 都 看 成 是 随机 变量 ) 的 概率 分 布 . 注意 


1 Nm 本 严 本 三 、 网 2 虽 
NE 一 叉 ) 一 X (za 一 工 ) 
1 


二 2 一 到 2 一 X (oa 一 1) 


而 且 二 者 相互 独立 , 故 在 五 下 统 讨 量 下 的 分 布 是 完全 确定 的 ,与 
AI 9 II ，AL2 02 无 关 . 当然 上 的 分 布 与 721 ,722 有 关 , 只 要 严 的 分 布 求 
出 来 了 , 则 不 难 确定 (4. 14) 中 的 Cl ,C2. 


定理 4.1 设 上 X (ma),7~X (ea) 且 8 与 了 相互 独立 ( 思 
d 
1m>D, 则 《二 多 全 的 分 布 密度 明 











四 UL 二 0 
7 十 7 
_ FT ) a 所 
As- 11 (aaa 2 
MT 72 \ 7 2 
网 汪 ) 
(4. 16) 
这 个 结论 在 初等 概 谈 论 中 已 过 ,证 明 方 法 是 直接 计算 两 


人 咖 从 -全 -了 


Ne 无 非 是 算 一 算 积分 ,这 


了 了 了 A  。 
Je 


从 略 ( 人 参看 [1]j). 表达 式 (4. 16) 以 后 并 不 用 到 ,读者 不 必 记 住 . 
定义 4.2 称 随机 变量 X 服从 目 由 度 为 mi,zz 的 下 分 布 (向 
记 为 X~F(Ga yz)) ,在 它 的 分 布 密度 有 表达 式 (4. 16) ,这 时 a 叫 
做 第 一 目 由 度 ,”: 叫做 第 二 上 自由 度 . 
从 (4. 15) 和 和 定理 4. 1 知 统计 量 生 服从 目 
的 顾 分 布 . 和 上 分 布 的 分 位 数 表 已 经 造 出 , 查 
Ci<<(C? 满 足 
| | Godu 十 | 了 ER 司 (xz)dx 一 a (4. 17) 


于 是 在 五, 下 PCFE<C;, 或 之 C:, ) 一 ax, 从 而 和 理 定 域 (4. 14) 的 检验 水 


平 是 v. 
:如 果 Ci 天 C: 满足 (4.17) 及 下 式 


PR AT 有 1 
呈 /11 ]  ，772 二 
三 


分 布 表 不 难 找到 


恨 1 | 了 1 (VvVJdv 一 1 一 w 








| .5 豆 (al 十 1)， 王 (nz 一 1) 客人 》 
这 里 
中 研讨 二 < 
1L2 一 12 | 
By) 是 8 分 布 的 密度 函数 , 则 否定 域 (4. 14) 是 一 致 最 大 功效 无 
ee 


在 实用 上 篆 取 Cl，C; 满足 
| 7 一 ， 略 op)dy= 5 一 ， 交 1 (y)dy 一 妆 (4. 18) 
0 1 2 1 2 2 


20. 3,20.0，18.8,19.0,20. 1， 20. 5 1 3. 1. 问 :70C 与 80C 下 的 强 
力 的 分 散 程度 有 无 差别 ? 
设 70 人 下 的 强力 为 X,80 父 下 的 强力 为 了 ,实践 经 验 表明 ， 
X~ NG ,ao),Y~NCa ,o)， 所 提问 题 化 为 检验 假设 刀 , : 叶 一 史 . 
根据 上 面 介绍 的 理论 ,应 取 统 计量 (4. 15) 及 和 否定 域 (4. 14) ,其 
中 CC: 由 (4. 18) 确 定 . 本 例 中 ,m 一 于 一 8, 取 v 一 0.05, 查 表 知 


] 
(一 了 (2 一 4. 99， 根据 所 给 数据 Z] 一 20， ba 一 2 2，y1 


二 ea 





一 7. 1 ,Vs 一 19. 1 ,算得 了 一 1. 07. 由 于 一 <<1. 071< 4. 99 , 故 


样本 未 落 入 否定 域 ,应 接受 五 ,, 即 认为 70 和 与 80 下 的 强力 分 


散 程 度 相 同 . 
对 于 两 个 正 态 总 体 的 伦 验 问题 ; 
万 。 :ol 委 oz 万 :ol 这 ai 
应 取 和 否定 域 


录 , 一 (正人 (CC，) 


2 


这 里 下 的 表达 式 见 (4. 15) ,C,， 由 下 式 确定 ， 


| JS (y)dy 一 a 


个 
HH 
-一 
《 口 
\c 


六 村 出 万 人 在 圭 本 山 
二 月 田 了 雪人 市 衣 人 各 出 ， 


数学 上 可 以 证 明 ,否定 域 (4. 19) 是 一 臻 最 大 功效 无 偏 的 . 
-类似 地 ,对 于 检验 问题 : 
态 。 :01 之 0 五 。 :al1.<< 0 


应 取 香 定 域 ， 


其 中 下 由 (4.15) 确 定 ,C: 由 下 式 确定 . 
K 廊 -wy)dy 一 wa 


~ 


| 
2 


由 于 | 四 wai(y)dy = w, 可 利用 正 分布 表 得 到 Ci 的 值 
数学 上 可 以 证 明 ， 否定 域 (4. 20) 是 一 臻 最 大 功效 无 信 的 


-ULBIALL1 


TI PE mm NA AT AN Tv 了 上 人 TAN、 一 T EL 和 Cr 个。 
个 4 7 ) 1 愉 办 人 人 扑 人 公 呈 可 站住 相 从 上 甩 /有 所 苛 
人 几 , 一 ((Cz Tu ?2 yy ):| 开 |>C) (4. 21) 
其 中 
元 一 了 77 77 17 一 L 
本 一 超 y 1722《 让 2 ) (4 . 22)) 
m1 12 771 十 7zz 


给 定 检 验 水 平 ,怎样 确定 (4. 21) 中 的 C 呢 ? 这 就 需要 人 研 究 
工 看 成 随机 变量 ) 的 分 布 . 


= TI 4 2 2 7 月- 这 岂 AT 
人 AL JJ 主 咖 。 属 2 入 ， 是 来 目 YAN\ 


Y，。 是 来 目 NE 。 ) 相 
独立 ， 则 在 对 三 于 ,一 ie 的 条 件 下 ,统计 量 天 ( 见 (4. 22) ,其 中 
y 分别 换 成 Xi ,YY ) 服 从 和 十 人 一 2 个 有 目 由 度 的 上 分 布 . 


汪 


证 明 : 记 = SwEf 汪 并 > or 一 肌 : 由 于 Cr 
X，) 与 (7 ) 相 互 独立 , 故 ( 台 , 与 (了 ,7) 相互 独立 . 根据 
第 二 章 定理 3.3, 双 与 6 独立 ,与 了 独立 ,二 6 一 X Cn 一 1)， 矶 9 人 ~ 
X (ma 一 1) ,于 是 斑 ,6, 了 ,7 相互 独立 .从 而 斑 一 立 与 人 


NT E 2 _ 2 2 nr 忆 7 二 AS | 十 T2 1 
洁 HR 一 /20l 一 02 一 0 0 有 二 ) < 汪 


< 


二 (6 十 7) 一 X (mm 十 me 一 2), 于 是 


了 了 口 
” LO “” 


(X 一 如 /oj/ 二 十 过 


Re 
(771 十 7， 本 2)ar (人 9 


证 毕 . 
Waskewwiseew 
(| 天 CC| 互 ,) 王 
此 时 ,和 理 定 域 (4. 21) 的 检验 水 平 是 v. 
否 旦 域 (4. 21) 在 直观 上 甚 为 合理 ， 数学 上 可 以 证 明 , 它 是 一 
致 最 大 功效 无 偏 的 . 
例 4.4( 例 4. 3 的 继续 ) 间 :70C 下 的 强力 与 80 CC 下 的 强力 
有 无 差别 ? 
从 例 4. 3 知 两 个 温度 下 的 强力 的 方差 可 以 认为 相等 , 即 ol 三 
0 , 故 问 题 化 为 在 四 =a 下 检验 五 :ma 一]2， 
根据 上 面 介 绍 的 方法 ,应 取 否 定 域 (4. 21). 设 c 三 0..05, 现 在 
7 一 7 一 8, 查 上 分 布 表 ( 自 由 度 为 阅 十 加 一 2 王 14) 得 C 王 2. 145 , 根 
据 所 给 的 16 个 数据 ( 见 例 4. 3) ,算得 统计 量 工 的 数值 为 2. 161， 
因为 T 王 2. 161 之 2. 145 , 故 应 否定 假设 五 。, 换 句 话说 ,70 人 下 的 


强力 与 80 志和 下 的 强力 有 差别 ,前 者 确实 大 些 . 


4 4 名 不 下 公 Y 门 友基 把- 方面 厅 折 和 昌 2 人 0 y 甘 /人 儿 三 | 工 信 
JJ Te ww BALL 呈 几 慌 LE 二 人 -人 LUUL DO 东 人 林 上 卢 中 一 -| 广 


的 35 岁 至 39 岁 的 非 怀孕 妇女 用 抽查 方法 收集 到 下 列 数 据 . 有 8 
人 使 用 口服 避孕 药 ,8 人 的 血压 (收缩 压 ) 的 平均 值 是 132. 86( 单 位 
是 mmHg 柱 ), 标 准 差 是 15.35; 有 21 人 未 使 用 口服 避孕 药 , 血 压 
的 平均 值 是 127. 44 ,标准 差 是 18. 23. 问 ;这 两 种 血压 平均 值 的 差 
异 是 否 “ 显 著 ”? 

我 们 假定 使 用 口服 避孕 药 的 妇女 的 血压 (收缩 压 ) 服 从 正 态 分 


三 人 什 E 门 HE 了 三 让 上 反方 Ar FEYT IC 和 I 二 9 人 于 六 
江 人 (Hua ,01 ) , 不 使 用 产 有 区 L 琳 二 有 六 有 JJLUUL CE、 六 HB 7 AL JLLAGAR 


分 布 人 Ca ,az 2). 假定 ol 一. 问题 化 为 检验 假 谤 末 。 :ma 一 ie， 
使 用 统计 量 (4. 22) ,现在 元 二 132. 86 ,7 一 127. 44,7a 一 8，7z 一 


ee 了 19 。 
< 间 芋 A 


No 


21 ， > ec 二 人 (yy 一 本 )2 一 20X(18. 23)2 ， 
可 算出 统计 量 et 74 设 检验 水 平 & 一 0 05 , 查 上 分 布 的 曰 


务 值 表 天 临 寞 全 和 三 2.052. 现在 | 了 工 |=0.74<2.052. 故 不 能 拒 


在 ci 一 a; 的 前 提 下 下 ， ,对 于 检验 问题 


一 《> 关 了 ~ 
470 :Al AL2 4 : KL1 -一 /2 


应 取 否 定 域 
太 , 一 ((Cziy， 319) 人 > CC) (4. 23) 
其 中 三 由 (4. 22) 给 出 ,C， 满足 
上 、\ 人 二 下 7 < 1 人 一 


| 如 + -2(y)dy 到 
J (> 


这 里 己 ( 妨 是 个 自由 度 的 上 分 布 的 密度 . 
可 以 证 明 ,否定 域 (4. 23) 是 一 本 
类 似 地 ,对 于 检验 问题 : 
末 , :ia et < 玫 0 
应 取 和 否定 域 : 
人 CC 《4. 24 1) 
其 中 了 工 由 (4. 22) 确 定 ，,C 满 起 


全 网 1 TY 
2 “有 二 开 一 忆 ， 产 二天 
有 1 一 Co 1 2 


LU JJ 人 


现在 人 赋 究 ci 专 吧 时 的 下 列 检验 问题 : 


由 古 上 证 明 泵 室 城 (4 254 月 _ 确 量 上 项 论 天 俩 藉 
站 人 “AN、 工 。 -HKX ro 


6 so :ML 一 Noe>。: :HI -的 Ha 
这 就 是 著名 的 Behrens - Fisher 问题 . 此 时 难以 使 用 广义 似 然 比 


检验 法 ,我 们 采用 下 列 解决 方法 ; 设 Xi ，- …*X， 是 来 目 和 CAa ;01 ) 


的 样本 ,yi ，…s*zYy， 是 来 自 Ni ,oz) 的 样本 ,二 样本 相互 独立 . 令 


1 了 ”19 人 一 人 YA\ 风 2 , 02 ) 的 人 


号 


二 








和 
1 二 
易 知 
2 
本 到 于 
和 7 一 NA 一 me 人 十 吕 
于 是 在 零 假设 Hi cm = 下 ,随机 变量 
4 斑斑 
CA 1 ) 
[2 
AN 7 /2 


见 | 引 | 的 值 太 大 时 应 拒绝 如 ,但 中 和 于 是 未 知 的 ,6 不 是 统计 
到 日 然 起 到 用 3 :公车 0 S3 代替 02 手 是 应 采用 统计 量 
> 了 人/ 肥 受 ， 且 


T 一 (又 - (4. 25) 
111 


当 | 他 | 太 大 时 应 拒绝 鼠 ,. 应 指出 的 是 在 瑟 下 人 的 精确 分 布 相当 
复杂 (而 且 术 赖 于 比值 c /az )， 幸运 的 是 , 可 以 证 明 ,在 五, 下 统计 
量 了 近似 服从 mm 个 自由 度 的 + 分 布 这 个 普 是 与 下 列 mm， 最 接近 


了 


JJ 拒 色 人 。 


(人 Si 二 S) 
EPE (4. 26) 
\7I/ 7/ 
利用 * 分 布 临界 值 表 ， 站 是 遇 界 值 4 请 旦 PCTI > 为 一 于 是 当 
且 仅 当 |T| > 时 拒绝 如 ma 一 如， 
类 似 地 ,也 可 解决 邓 所 co 人 。: 语 和 pe 的 问题 . 
例 4.6 研究 患 心脏 病 的 父亲 是 否 引起 子女 的 胆固醇 水 平 全 
高 的 问题 . 随机 调查 了 100 个 2 至 14 岁 的 孩子 (其 父 皆 死 于 心脏 
病 ) ,其 胆固醇 水 平 的 平均 值 是 207. 3 ,标准 差 是 35. 6; 另 外 ,随机 


一 生 一 二。 一 


调查 了 父 杀 无 心 胜 病史 的 74 个 2 至 14 岁 的 孩子 ,其 胆固醇 水 平 
的 平均 值 是 193 4， ,标准 差 是 17. 3 ， 问 ] : 前 者 的 胆固醇 水 平 的 平均 


-有 局-P 恰 








设 父亲 死 于 心脏 病 的 孩子 的 胆固醇 水 平 X 服从 正 态 分 布 
NG yal)， 父亲 无 心脏 病史 的 孩子 的 胆固醇 水 平 服从 正 态 分 布 
Ni yo). 这 里 参数 ol, ol 都 是 未 知 的 . 我 们 要 检验 的 假 
作 是 五 :ma 一 1 

首先 判别 ol 是 否 等 于 到 .使 用 统计 量 下 三 Si/Sz ,这 里 Si 和 
S; 分 别 是 两 个 样本 的 方差 ,经 过 计算 知 节 上 =4:23. 利用 否定 域 


(4. 14).， 对 于 wx 王 0. 05, 查 表 得 C; 王 0. 654 8,C, 一 1.549 1， 现 在 
TS 二 rnHTh7T AI 人 全 全 2 


为 了 检验 互 。 :一 pa 使 用 统计 量 (4， 25). 现在 X 王 207. 3， 
Y 一 193. 4. 代入 后 和 统计 量 工 的 值 为 3. 40， 

从 (4. 26) 知 1 ” 三 151. 4. 于 是 ,在 万。 下 统计 量 开 近 似 服 从 
151 个 自由 度 的 上 分布. 设 避 ys(0) 是 7 个 自由 度 的 上 分 布 的 0. 975 


分 位 数 , 则 在 Fr 下 下 忆 (| 了 | 之 加 95(15 51)) 二 0.0o0 夏 临 界 值 ) 王 
fo.or5(151)<<t.sxs(120) 一 1. 980. 现在 | 了 开 [ 一 3.40 之 1.980 ,因而 应 
拒绝 五 ,: : [LI 一 /2 即 可 以 认为 胆固醇 水 于 的 平均 值 有 显著 性 老 
异 ,父亲 无 心脏 病史 的 孩子 的 胆固醇 水 平 的 平均 值 确实 低 些 . 

成 对 数据 的 比较 

有 些 实 际 问 题 里 的 数据 是 天 了 然 成 对 才 的 :(Cziy yi )，……，(Zuyyn)， 
其 ”9 尼 来 自 某 总 体 ,> ，…，2 来 另 一 个 总 体 ， 日 z; 与 y， 
不 全 了 人 症 mm ”vv 田 划  ，  ， 捷 
个 能 淮 为 是 相互 独立 的 . 设 顾 7， i; 王 Al 2 《这 生 访 Zi， yi 有 


成 随机 变量 )， 要 检验 的 假设 是 责 :由 一 司 : 怎么 办 ? 伶 过 一 姜 二 


yi 一 工 ， 3 通 币 在 实际 工作 中 假定 之 ] 9 ”9 之 7 是 来 自 某 个 
正 态 分 布 N(m 一 户 ,) 的 简单 随机 样本 (o: 未 知 )， 为 了 检验 


一 亚 ” WA AP 下” 副 


电 。 : [1 一 /ii ,可 使 用 统计 量 





和 (参看 (4. 3)) 《4. 27) 


. 当 ITI>。 时 拒绝 吾 。， 





这 里 蛋 秀 值 ， * 根据 检验 水 平 w 来 确定 . 

例 4.7 为 了 鉴定 两 种 工艺 方法 对 产品 某 性 能 指标 有 无 显著 
性 差异 ,对 于 9 批 材 料 用 两 种 工艺 进行 生产 ， 往 到 该 指 标的 9 对 数 
据 如 下 : 

0.20 :0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 

0. 1]0 0.21 .0.52 0.32 0.78 0.59 0.68 0.77 0.89 
问 :根据 上 述 数据 ,能 否 说 两 种 不 同 工 艺 对 产品 的 该 性 能 指标 有 显 
著 性 差异 ? (检验 水 平 一 0. 05) 

解 ”考查 9 对 数据 的 差 :z” ,…，,zs， 使 用 统计 量 (4.27). 查 : 
分 布 的 临界 值 表 得 临界 值 \ 王 2. 306( 自 由 度 是 8). 现在 统计 量 了 
的 值 是 1.5<、). 故 不 能 认为 两 种 工艺 下 该 指标 的 平均 值 有 显著 性 
差异 . 

以 上 我 们 对 于 一 个 正 态 总 体 .两 个 正 态 总 体 的 假设 检验 问题 
进行 了 比较 完全 的 讨论 . 利用 广义 似 然 比 检 验 法 导出 了 各 种 检验 
问题 的 具体 否定 域 (Behrens - Fisher 问题 的 否定 域 除外 ) 这 些 否 
和 定 域 经 过 各 自 的 数学 研究 大 都 有 其 种 优 自 性 一 一致 最 大 功效 


“AN 一 上 人 并 请 及 和 本 ViA7ANARF 站 AT ZU 1 一 TO 二 ER 


无 偶 (UMPU). 为 便于 查阅 ,我 们 把 正 态 总 体 情 形 下 的 各 种 检验 


站 申 检验 综 计 有 旺 太 示 定 域 列 汶 表 4 ] 与 表 4 0 
加 大 、 亿 下 蕊 计量 必 人 和 下 卉 2 /到 十 ' 工 汪 。 乙 。 


在 表 4. 1 和 表 4. 2 中 一 总 体 情形 ,Xi ,…，,X, 是 来 自 N Cu，o2) 


的 样本 ;在 两 总 体 情 形 , Xi,…,，X, 是 来 自 NGCaycol) 的 样本 ， 


y .YY 是 来 白 N Nt vv 有 目 ; 个 自由 度 X 分 布 

1 9” 9 人 上 小- 占 人 Ca ?02 7/ 有 Ji。 人 -LICIA 和 7 有 问 DA 人 /JJ 4 

的 密度 图 数 ,xCzjiz2) 是 2 个 目 由 度 上 分 布 的 密度 图 数 ，FCzi7zaa yzzz ) 
天 AjNA -内 放下 基 一 TTATFT 


是 目 由 度 为 721 和 7L2 的 工 刀 4 人 的 密度 郴 数 . LV 表示 人 否 定 域 是 
-一致 最 大 功效 的 ,UMPU 表示 否定 域 是 一 臻 最 大 功效 无 偏 的 . 

对 于 非 正 态 总 体 ,广义 似 然 比 检验 法 也 是 可 用 的 . 要 注意 ,不 
是 在 所 有 情况 下 广义 似 然 比 检验 法 都 好 . 


Ye 和 


例 4.8 设 X 取 值 限 于 集合 {2, 一 2,1, 一 1,0} ,PC(CX 一 7z) 一 
b(zy0)(0<0<1) ,其 中 b 是 未 知 参 数 ， 本 


, 表 4.1 正 态 总 体 参 


备 择 假设 如 检验 统计 量 














委 o 委 do 人 


数 的 检验 (一 ) 
RE 
自由 度 | 否定 域 C 的 决 . 征 最 优 和 性 


本 


CGI0 





四 we 





表 4.2 正 态 总 体 参 数 
2 
… 零 假 设 号。 备 择 假设 互 ， 检验 统计 量 分 布 





01< 妇 0 < 委 c; |c2<<c3? 或 52 53 
HAS-Ao 凡 之 A0 








0 盖 0 


形 JTJ2v>0 7T2 0 人 VC 人 一 Ao 1 
了 | ER 全、D / 
/一 /ao /无 /no Wan 
;一 1 


0l/os 雪 An 0i1/o2 > 4 














一 co < 1， 一 cc < AI， : 
ee | 
3 /1I2 一 人 ?1/o3 姜 人 A 本 ao 7 一 1 
| 2 一 馆 0 Il1/GI2 0 X7 
| 一 束 : 
一 co << [1， 一 co < ]， 7 一 1 
HA < co A2 < co 





昌 严 1 
] 一 /2 1 2 
六 天 上 /7172(21 十 ?2 一 2) 






1 人 克 (近似 ) 








[9 m-( 时 + 显 ) [5( 一 ) 六 +-i( 县 ) 












[Cayo 5 fC,/e: 
jc X (TH 一 1)dz 芝 0 
17 92 


27 oz 


? 
Ciyez 





驼 (zim 一 1D)dz 一 1 一 a 








| Aczim 一 1,z2 一 1)dz: 一 wa 





《71] 一 1 ,7 一 ]) 

三 <<C; 或 | 人 UMPUjJ 

2 = | zj 一 1 22 一 ])dz 三 一 _C_ (近似 ) 
Jo 2 










(7 十 7 一 2) 








己 吕 


及 L | f『 3 本 二 Yiv 
! 一 人 L 人 一 w 较 优 





7])2 


(与 mm 最 接 
近 的 整数 ) 
| PC | ziopDdz 一 全 





吕 


~ 








加 立 一 0 
0OC ， 人 
ee 元 二 于] 
1 一 wx\VLZ 人 
六 zz,0) 一 4 RE (0<<0O<<]1) 
| Z 一 0 
二 
四 


全 究 检验 问题 : 
亲 。 :0 一 0 二 万 :0<0 一 1 


为 了 寻求 广义 似 然 比 检验 , 先 计算 广义 似 然 比 ， 设 样本 是 X， 
样本 量 是 1) ,广义 似 然 比 为 


沪 
泽 








水 平 是 QW 的 否定 域 为 人 W 。 一 《人 Z:A(CZ) ,其 中 人 Ao 适合 
PCOX E 风 lb 一 0) 一。 





人 PCACXI) 二 io| 万,) 王 POCOXI 一 十 210=0) 一 a 
故 否定 域 是 柬 ,= 王 (2, 一 2} ,功效 函数 
P(ACXD > 这 | 六 PCGX， _+2l0D=bC4C De 


一 L<a (0<O< |) 


可 见 这 个 检验 法 不 是 无 侦 的 . 下 本 本本 和 光 全 人 , 取 否 定 域 确 : = 


nn HH HL 和 一 AN HH 二 rz2OU 
“19AF HL 人 1 人 人 时 拒绝 互 。: 


此 时 PCXE 克 10) 一 加 0,0) 一 ac。 功效 函数 


呈 


一 





PCXIE 风 10) 一 训 0,0) 一 w 


此 检验 法 是 无 候 的 . 

作为 本 节 的 结尾 ,我 们 指出 F 分 布 是 应 用 极 广 的 分 布 . 除了 
在 正 态 总 体 的 检验 问题 中 常用 到 下 分布 外 ,下 分 布 的 分 位 数 与 6 
分 布 的 分 位 数 有 密切 关系 . 

引 理 4.1 设 X 与 相互 独立 且 X~X (nz),Y~% (aa) , 则 


i >。 (0<0 一 1 


有 


的 分 布 函数 是 .8{ xz; 于 ,于 (8 分 布 ) ,这 里 
0 


2 





0 
| zx 1 一 2 dt 0 委 工 和 卫 ) 


】 
| 


RS 


L 


> 0 过 0,B(D0 一 | 一 dz 
证 明 ;: 令 v=X 十 Y, 直 接 计算 (U,V) 的 联合 密度 ,不 难 推 知 U 
的 分 布 函数 正好 是 上 述 的 p(zi 了 2， 罗 ， 详细 叙述 从 略 . 


证 毕 . 
引 理 4.2 人 区 Bi (天 1， 天) 是 8 分 布 ?Zi 天 ,天 ) 的 7 分 位 数 
( 目下 救 娄 扩 (县 白 由 话 册 和， 的 万 修 在 的 LA 
\ 二 yl 94ALZ 人 人--JLL IE 印 A 7 9L 7 39393277 人 HL AI HVJL BRRHJA /5 
v 数 , 则 




















BCK KE) 一 [ 人 
了 7 人 < 玫 1，2 攻 2) / 

证 明 : 机 RE 和 且 
一 全 2 。 勾 
K， 了 

U 一 盖 二 

ATF 

且 下 服从 自由 度 为 2K: ,2 天 。 的 下 分 布 , 于 是 

BCzi 天 天) 一 PCU 委 7z) 
=P{ 下 茎 于 -二 -| (0<z<1)， 


由 此 可 疯 


下 。_ (KK2) 
(2 天 1 2K2) 一 玉 。 了 虐 一 DB 长 >) 
故 (4. 28) 成 立 . 本 


公式 (4. 28) 是 很 有 用 的 . 设 X 服从 伯 努 利 分 布 , P(X 王 1) 二 
妨 一 1 一 了 (二 0)，0 委 和 1, XXX 是 X 的 样本 ,从 第 二 章 例 


3.3 知 刀 的 7 水 平 置信 下 限 是 如 (>,X), 这 里 关 0) 一 0， 
思 ( 开 )( 开 过 1) 满足 方程 


用 六 力 ( 玉 ) 

17。 人 7 一 玫 1- 
ee 二 
KITTIOERJj， 人 “ 

不 难看 出 (天 ) 一 了 _ (天 ,2 一 天 十 1) (8 分 布 的 分 位 数 ) ,从 


(4. 28) 知 


二 


11 一 让 1] 本 
人 FTCGERTECRTD 
0 
一 (十 (2(z 一 民 十 1)，2K) (4. 29) 


所 以 可 用 节 分 布 的 分 位 数 表 来 求 如 的 置信 下 限 . 


WODm 
”LOU ” 


$5 临界 值 和 己 值 


前 面 说 过 ,给 出 一 个 检验 法 就 是 要 给 出 一 个 否定 域 . 否定 域 多 通常 是 


由 一 个 直观 上 有 了 明确 意义 的 统计 量 p(Xi ,…, X,。) 来 确定 ,确定 的 方式 可 概 
本 


友 一 (zeoCz ys) >A) (5. 1 ) 
第 二 种 (双边 情形 ) ; 

厂 一 {(Czly，， 9 … Zn) :DCZI1 Wi 或 DPCZI 和 并) 017) (5。 2 ) 

这 里 叫 作 单 边 情 形 的 临界 值 ,i， 入 叫 作 双边 情形 的 临界 值 . 临界 值 是 


根据 检验 水 平 w 永 确 安 的 ” 涵 当 对 干道 沪 情 形 应 排 ) 滩 品 
候 扩 人 己 狼 水 站 处 傅 正 时 . 进 吊 , 刘 丁 时 过 情形， 以 找 4 潢 正 


Re PoCPCA1，…，A 和 As) 人 人 一 a Co， 3 ) 


Am 一 Am 玫 。 一 二 =- 站 二 I 于 mr 


这 里 “06 Bo ?是 零 假 设 互 ,P, CA) 表示 参数 的 真 值 是 0 时 事件 人 
于 这 个 ,(5. 3) 式 表明 否定 域 (5.1) 的 精确 检验 水 平 恰好 是 w. 
当 满 足 (5. 3) 的 太 不 存在 时 ,应 选 满 足 
SUP Po (PC(XI，…，Xn) 人 人 )<a<sup Po(Cp( 过 >A) 《5. 4) 
“0 0 


此 时 ,否定 域 (5. 1) 的 检验 水 平 不 超过 v. 
对 于 双边 情形 应 选取 :< 满足 


的 概率 ， 对 


sup Pi(Pp( Xi X)<<hi) 一 全 (5. 5) 
“50 ” 
sup PC9p(X 这 本 (5. 6) 


必 eu 
对 这 样 的 和 ,否定 域 (5. 2) 的 检验 水 平 不 超过 c. 当 这 样 的 不 存在 时 ， 
应 选 和 满足 

SUP 下 OA < 

pc 60 

PCP(AI 和 ) 入 Al) (5. 7) 
当 这 样 的 iz 不 存在 时 ,应 选取 > 满足 
so Pi (PC(XI ，…,X) 盖 ja)<<- 


Sa PC Xe)>h) (5. 8) 


人 
区 《7 


此 时 否定 域 (5. 2) 的 检验 水 平 不 超过 v. 


Yi JTJ 上 ATTA _ tv Ap 人 大 1 站 


上 述 根据 检验 水 平 a 确定 怖 押 什 4 或 和 忧 从 而 获得 否 和 
简称 临界 值 方法 . 这 是 本 书 用 来 确定 否定 域 的 基本 方法 . 读者 容 


二 下 太 着 人 开国 下 二 RAR 全 rrTb 尼 R 上 FE 人 一 7 名 中 zi 
因 六 JJ 下 蚊 姑 人 有 了 了 隐 人 和 丽 则 JJ 癌 定 域 都 是 用 这 、 | 刀 人 人 骨 下 昌 3 


我 们 指 出 ,还 有 一 种 确定 否定 域 的 方法 一 一 请 值 方法 . 该 方法 可 提供 人 


了 4 >。 上 
上 灿 则 刀 愉 ， 
易 看 出 


的 
看 出 ,前 


先 研究 单 边 情形 的 否定 域 (5 1). 设 石 ,xz 是 样本 值 (已 知 的 个 芝 


访 ( 妈 2) 一 sup PICp(X Xp(2 8))》 ， (5.9) 
2 


这 里 “9E @ "就 是 零 假 设 瑟 o. 加 (对 ，… 双 ) 是 责 。 成 立时 统计 量 取 值 不 小 于 
p(z，, 双 ?的 最 大 概率 ， 

定义 5.1 zz) 由 (5.9) 定 义 ) 叫 作 单 边 情 形 下 样本 值 Czi，…， 
zx) 的 访 值 . 


旋 值 的 重要 要 性 在 于 下 列 
引 理 $.1 设 对 给 定 的 cE (0,1) , 怡 有 一 个 和 满足 
) 


SS AN 一: YE TAN 
人 PCP(A1，… 9 人 An -一 A 人 /一 人 JJ。 7/ 
0OcC @ 
i| 0 。。 0NY、、1 的 充 要 和 条件 是 轧 ( Z 70 》 < 一 
六 JJ TYT\ <I19 99“<n7 一 人 RH 女人 下 1 和 二天 \ ”9 过 mn 7 ~ 人 CQ。 


这 个 引 理 告诉 我 们 ,在 条 件 (5. 10) 下 ,样本 值 (z,…,z) 落 入 检验 水 平 


和 的 否定 域 (5. 1) 的 充 要 条 件 是 样本 值 的 六 值 小 于， 揽 癸 证 说 当日 公 当 


了 
As 人 CRY AU- AN II AAA- LN PP HE JJ JJ LN JJ 四 区 一 -| Lv 一 


样本 值 的 馆 值 小 于 ma 时 拒 缀 万 ,. 即 和 否定 域 (5. 1) 可 表示 为 {((zl，…，Zn ): 
pz yz)<a}， 这 种 用 少 值 确定 否定 域 的 方法 叫 作 ， 值 方法 . 值 方法 


HL “上 mw 和 Ar ii RE LA 


的 优点 在 于 :不 预先 确定 检验 水 平 ,从 计算 出 的 问 值 知道 ,对 一 切 大 于 这 个 
户 值 的 , 则 拒绝 H。 引起 的 错误 其 概率 不 超过 v. 

户 值 训 ( 妈 ,和 …z) 也 可 看 作 是 样本 (zz?) 与 零 假 设 鼠 。 相 容 程度 的 
度量 . 之 值 越 大 , 相 容 程度 越 高 ;反之 , 刀 值 越 小 , 则 相 容 程度 越 低 . 户 值 小 到 


一 定 程 度 则 认为 二 者 不 相 容 了 , 即 应 拒绝 互 ,. 当 嫁 值 小 于 oa 时 认为 二 者 不 相 


容 ,这 时 拒绝 忆 , ,引起 的 错误 其 概率 不 超过 


BiyBEc 1 ae 人 7v 0 mi Pr rm ， mw、\、~ 
5 引 于 5.1 的 证 明 : 议 zz)<a 则 sup LOD(AI，…， 人 nn) 之 
， bc 6 
(《 盖 9 >07< 一 ~ 从 CS 10y40 (0 ro 所 计 吏 滑 (0 0 
Vi na 从 1) 有 OZ) 一 人 凡 过 外， 芝 OAZI Zn 一 


力 (2Zi 9 Zn) 一 Sup PCCPCA1 9 ” ) ) 之 0CZi 检 二) 
0 
入 sup Po CeP(XI 和 和) 全 DCZI Za) 一 人) 
0 
< Sup PCPCAl 9 ,和 ) 六) 一 a 
Oc 60 


AN 


当 检验 


一 上 


7 NA 


X，) 离散 型 随机 变量 时 常 出 现 这 种 情况 ). 此 时 应 考虑 格 
的 检验 . 我 们 可 推广 引 理 5. 1. 


引 理 $.2 设 对 给 定 的 ecE (0,1), 有 满足 
sup Pi (Cop(XI XDA)<<a 
6 60 


给 定 acEC(0,1) ,不 二 _ 定 有 满足 (95. 10 ) 


吕 
蕊 
仁 
夫 
愉 -< 
询 
才 


和 sup PoCPCAI，…， 入 。) 之 人 ) (5. 11) 
则 2(z 和 za) 过 人 的 充 要 条 件 是 
户 (Z1 Ta ) < 


证 明 : 设 DC(CZ1 9 ,2 ) 盖 人 ， 则 
力 (2 9 ””” Rn PPOCA1 和 , 太 。) 之 OZi 儿 ””” ,Zn ) ) 


忆 PCCP 和 AT， 入) 全 人)<a 


0ce6o 


反之 ,在 pCzi，…zna) 福 1, 则 


户 (Z1 “Zn) 之 SuP PCPp(Xi 有, ) 之 人 7) 之 a 
pe eu 
PE 
凡 L 一 全 。 
从 引 理 5. 2 知 ， Raw 则 否 机 一 (Caa)59(z ye 
一 人 人 王 小 ca 和 而 且 冬 本 但 9 ny 和沙 人 并 已 元 立 守 人 年 攻 


生生 
站 
四 


样本 值 的 包 值 小 于 Q 。 
例 $.1 设 X~NCo), 未 知 , 检 验 假设 丽 。 :ps 生 0-( 备 择 假设 是 瓦 ，: 
pm)， 此 时 应 取 香 定 域 (参看 (4. 5)) 
允 三 (人 (zy Za):0DCZT Zr) 二 7o) 





其 中 OAZ1 0 全) Y S /nm， 2 二 >) ,3 一 > (2 一 并)? ? 
1 5 1 


7 一 上 
一 上 (一 1)(2 一 1 个 自由 度 寺 分 布 的 1 一 vc 分 位 数 ) 


PK LA RER RN 二 -有 1L 攻 AAA]。 


根据 样本 什 立 ， ., 翅 , 我 们 可 直接 计算 户 什 : 
力 (Zi Zn) 一 Sup 天 (COCA1T 从， ) 之 DCzl，， … Zn ) ) 
| bce 


下 
AD 


本 
je 
CD 
(3 

电 


这 里 0 一 (po ) ) 的 (ed ) : LS AL0 ,0 0). 


访 ( 友 9) 一 P 2 (CTp(z 2 )) 


二 Hz AAAY 一 
岂 国 HATRRJ TI 电 LU 莹 于。 因此 户 (>= 


值 小 于 x 时 拒绝 五 


刀 
仿 验 假设 百 ,过 25, 根 据 样本 值 x 


II 区 祁 02、 根据 样本 值 世 9 ”64 一 


7. 3. 故 p( 阅 ,和 …zg) 一 1.731. 可 计算 出 闷 值 
思 (ZI ,zzo 一 PCOT>1.731) 一 0. 044<0. 05. 
故 对 于 检验 水 平 w=0. 05 应 拒绝 互 ,. 
现在 来 研究 双边 情形 的 否定 域 (5. 2). 我 们 不 去 具体 确定 和 和 )z ,但 从 


| 
| 


LE 7 瓦 矿 上 庆 ， 一 上 上 二 后 -er 义 和 (5. FAN APF_AmAN =Th Za 。 ED 一 、 -一 
5 杞 /里 AAAL。 ,有 ) 的 直观 意义 和 ( U/7、\u suD7r-J 于 yy Ao 二 止 Al1 ~ 人 人 oo 一 
和. 设 阅 za 是 样本 值 , 当 p( 嫩 za) 魏 i 时 令 
Ar 0 ON ”1D Dr rr YN 
及 ZI ZTCpn / nintcSup 人 69OAA1， 全， / 
pc en 
RE C >033 1 (CS 12) 
md 1 9<LPAZA9 工 | Do。 
当 p(z…Z)X 时 令 
力 ( 二 1 2Z0) 一 min{f2su Up Po(XI ，…， 和 人，) 
上 5 了 工 了 天 
了 
之 DCZ1 9 人) ,1 》 [59， 13) 
Ya PE 6 一 一 9 Dr T 了 了 
和 过 主 KB 是 令 亿 以 0。 / 
定义 $.2 由 (5.12) 和 (5.13) 定 义 的 pz ze) 叫 作 双边 情形 下 样本 


值 Czf ，…,z90) 的 轧 值 . 
户 值 的 重要 意义 见 下 列 引 理 . 
引 理 $.3 设 对 给 定 的 cE (0,1) ,有 唯一 的 和 唯一 的 )， 满足 


SUDP 上 PCA1 2 , 从 ，) < 一 人 1 )<< 二 


0Oc 吕 4 
0 
<<Sup Po CDPCXKIT 及 ) 入 Ai ) (5. 14) 
bc 6 
2 0 
SU 去 日 中、 人 1 3? 9 LA -AAA2 7/ 1 
ben 
<<SUp 忆 CO 人 AI 入) 之 12 ) (5.。 15 ) 
0 el 
则 “p ( 刀 了 双 )<A 或 po( 观 … 和 了 ) 二 2” 成 立 的 充 要 条 件 是 
户 (zi .2 ) <<a 


证 明 : 设 DCZI ? 0 ) << Ai , 则 OZ1 9 ””” JE (这 是 由 于) El ,人 2 ) ) 


于 是 从 (5. 12) 知 


<p(zi ,并 0 ) ) 


Sa FoCP4CA1，…， 和 )<41 一 有) 下 


<a( 对 适当 小 的 s 盖 0). 
奉 p(CZzl，… Zn ) 一 , 则 存在 s>0 使 得 p(zi ，……Zzn) 二 AMz 十 s. 于 是 


9 
ATY 一 0 NG DY TV YY ANY 一 0 5 oONY 
PP 才 1 mm7 ~ 局 UH 4 0、 中、 人 4 企 ] 9 9 L 全 / -一 和 二 1 ? LI AZ 
6Ee0 
< 环 sam P 户 (CCX X > 全 1] 十 =<) 
Te “有 卫 上 本 到 刘 Ar 1 
6E B0 
< a 


yp xzn) 小 于 Al 或 大 于 ): , 则 一 定 有 户 CZ1， 和 9Tn) < 
另 一 方面 , 设 本 …，IZn )<<a. 若 力 z ”9 之 mn < , 则 
从 儿 ae 


< mn PDTY (了 Y \< 一 ro0 0 
UP 0\ HP LI19? 9 LAPn 7 msD\ 二 1， ny 人 ~ 人 人 C。 
bc 80 
IC 1T4NVAIT -0 。。。 -0\ 一 -让  7 _0 ON、 并 寺 
从 L+/ AN DZ1， ?nn7 AI 和 有 石 9 1， ?nn7 -一 人 A 人 0， 灵 
2sup PCp(X，…，X) 之 PCZI1，…，Zn))<<a. 
从 (5. 15) 知 D(ZI， Zn ) 盖 》 2。 因此， 只 要 六 (zzo)<a 则 一 定 有 
Ce Z0 ) < 一 ) 论 (> ro JS 232 证 比 
溯 一 1 ~ 或 p(CZl， Zn) AN，51 理 5， 3 LT 。 


引 理 5 3 告诉 我 们 ,为 了 检验 假设 .Bi :9E Bo ,否定 域 友 ={(Cz，…yzu): 
p(Z 和 Zn)< Al 或 p(z…zo)Mz) 的 检验 水 平 不 超过 xc( 有 时 检验 水 平 
恰好 是 x) ,而 且 在 引 理 5. 3 的 条 件 下 ,样本 值 (,…，,z) 落 入 这 个 否定 域 的 
充 要 条 件 是 样本 值 的 请 值 小 于 v. 这 种 用 嫁 值 来 确定 否定 域 的 方法 仍 叫 做 
值 方 法 . 

双边 情形 下 之 值 方法 的 优点 与 单 边 情 形 下 疡 值 方法 的 优点 是 一 样 的 . 
效 不 更 述 . 

户 值 方法 有 很 大 优点 ,但 也 有 习 舌 之 处 处 .: 要 根据 样本 值 计 算出 相应 的 tp 
值 . 有 时 这 种 计算 还 相当 复杂 . 夺 在 一 话 常 见 的 恨 设 检验 问题 里 , 值 的 计 
算 程 序 已 在 流行 的 统计 软件 包 ( 如 SAS) 中 给 出 . 使 用 这 些 软件 容易 算出 
旋 值 . 站 4 

例 5.2 设 X~NCo oz oa 均 未 知 , 为 了 检验 假设 Fi := 四 (am 已 


知 ) ,前 面 说 过 应 使 用 统计 量 PC(X; ,… = 言 忆 (和 一 X)?. 当 9p 值 太 小 或 


了 DEFE 
LDO 


故 应 采用 双边 情形 的 否定 域 
.ri) < 或 PCAZ1 9 , 了， ) 人， } 


太 大 时 应 拒绝 万 。. 


下 厂 7 N Ar 
YY 一 《Zi ?noD TI 


如 何 计算 样本 值 ( 世 9 ” ,2 ) 的 北 值 呢 ? 
从 直观 上 看 ,如 果 也 ， 成 立 , 则 < 允 应 该 和 1 相差 不 太 大 ， 故 在 


娘 的 表达 式 中 履 应 小 于 2 一 1,)， 倍 大 于 7 一 T， 取 1 一? 一 1. 则 和 <Ao<)s 
, 芭 )<l 的 充 要 条 件 是 S: 福 中 ,这 里 守 一 -一 >) (对 一 瑟 ) 
1 


注意 ,p(zi ，… 
人 1 < 人 
全 上 
大 污 
于 是 ,从 定义 5. 2 知 S 委 ci 时 
力 (zl ， 一 min{2sup P, (Co( 和 1 < 福 oo ) 1) 
。. 如 0 
0 5 


这 里 0 一 (0 人 ) ,Bo 王 (( 人 天) :任意 yc 一 0 ,oo 一 CCZ1 ， 
匈 知 训 zl nr) 一 min{(2P(6Gm),1) ,这 里 随机 变量 拓 服 从 ”一 1 个 自由 度 


的 X 分 布 . 
类 似 地 , 当 S: 二 到 时 
方 (zz ) 一 min{2P(E2wo ) 1) 
(6 及 wo 之 含义 同 前 )， 
根据 例 4. 2 中 提供 的 10 个 数据 , 知 
全 
10 
65， 


P(E 三 mw) = 0.30( 因 为 服从 9 个 自由 度 的 X 分 布 ). 于 是 清 值 = 0. 60. 可 
0. 60 ,在 检验 水 平 < 下 都 不 应 拒绝 假设 妃 v :co 一 64. 


见 对 一 切 c 反 
8$6 ”比率 的 假设 检验 


设 X 服从 两 点 分 布 ( 伯 努 利 分 布 ). X 取 值 0 或 1 且 PCX== 
1) 一 加 一 1 一 PCX 一 0), 这 里 之 是 未 知 的 . 如 就 是 所 谓 的 “比率 ” 
当 1 表示 成 功 ,0 表示 失败 , 就 是 成 功率 ; 当 1 表示 有 效 ,0 表示 


无 效 , 就 是 有 效率 . 


了 站 挛 二 
宣 


” LDO 


先 讨 论 一 个 总 体 的 问题 此 时 ,对 的 假设 检验 问题 主要 有 
下 列 三 个 . 

(1) 万 , :pp 委 四 万。 :二 加 

《2) 互 。 :1 之 加 > 万。 : 盖 思 

(3) 万 , :pp 一 着 厅 ， 力 苹 加 二 


VS aa0 人 EL 0 二 去 G WE 0 
这 里 妃 , 是 要 检验 的 零 假 设 ( 其 中 如 已 知 ) ,有 ; 是 备 择 假设 
首先 讨论 上 述 问题 (1). 设 X 的 简单 随机 样本 是 泡 . 
ALL LA 一 上 人 -一 | Ac \ 荆 / 。 LA AL 这 有 这 宁 


很 自然 想到 请 的 估计 量 记 一 二 1 ,当即 较 大 时 沁 应 与 之 很 
接近 - 当 方 比 训 大 得 多 时 应 拒绝 也. 令 S 一 六 藉 ， 故 对 问 定 的 


当 S 足够 大 时 癌 拒 绝 万 . 所 以 埋 定 域 是 {( (站 yo) 3 宅 5| 
其 中 。 c 是 临界 值 设 检验 水 平 是 xc, 取 - 为 满足 下 式 的 最 小 性 


Se 
SUupb 人 (5 之 c) saQ . 
bb< 思 0 


1 ) 


3 


77 | 人 DT] NI 
人 \L 上 一 以/ CQLK 
(之 1, 见 第 二 章 ) 
由 于 P,(S>&) 是 嫁 的 增 函 数 ， (6， 1) 化 为 
王 ， (3 之 c) 入 wa 《6. 2 ) 


我 们 不 去 求 这 个 c( 满 足 \6. 2) 的 最 小 整数 ) 而 是 另 想 办 法 判别 事 
件 “S 达 c" 是 否 发 生 . 设 样本 值 是 二 ,zs Cn 个 已 知 数 ). 令 % = 
2) 妈 . 显然 ,从 (6, 2) 知 %c 的 充 要 条 件 是 


N 


CipiG 一 加 ma (6. 3) 
设 方程 
忆 coa- 盖 一 《6. 4) 


的 根 为 履 (3 )(so 之 1)， 此 外 ， 规定 z2。 (07 一 0. 易 知 . zu 入 加 (so). 


故 当 日 仅 当 十 FL 
RPR 地- 已 LI 和 局 写 a (so) 之 加 时 J 记 一 [ 末 : pp 委 加 . 


怎样 计算 如 (so) 呢 ? 有 下 列 公 式 ( 人 参看 (4. 29) ) ， 
轴 Go)=( 人 (1 二 一 局 人 0 (6. 5) 


人 例 6.1 一 种 广泛 使 用 的 药 治疗 慢性 支气管 炎 的 有 效率 是 
0. 80. 现在 一 家 制药 公司 推出 一 种 新 药 ,声称 :治疗 慢性 支气管 炎 
的 有 效率 高 于 0. 80， 但 药 价 比 广 泛 使 用 的 那 种 药 减 少 四 分 之 一 . 
为 了 验证 新 约 的 有 效率 是 否 高 于 0. 80， 收集 了 临床 试验 数据 . 从 
使 用 新 药 的 病人 中 随机 抽查 了 30 人 ,其 中 27 人 有 效 ,3 人 无 效 . 
问 :能 否认 为 新 药 的 有 效率 高 于 0. 80? 

解 ”用 X 表 示 使 用 新 药 的 效果 .X=1 表示 有 效 ,X=0 表示 
无 效 . 现在 样本 量 ”= 30, 样 本 值 之 和 * =27, 设 检验 水 平 一 
0. 05， 从 (6. 5) 知 

刀 om) 一 加 mm(27) 一 人 1 十 芳 Foss(8,54) 


一 
NA 人 < AR AN 


= (1 十 芒 X 义 2. 13 ) 一 0. 76< 加 一 0. 80 
改 不 能 拒绝 责 。:z 委 加, 即 没 有 理由 说 新 药 比 旧 药 有 更 高 的 有 
效率 . 
顺便 说 一 下 , 若 30 人 中 有 28 人 有 效 , 则 可 计算 出 puw(28) 一 
(1 十 六 Fes(6,56)) 二 0.814> 包 . 故 要 拒绝 再 , 即 可 认为 新 药 
有 更 高 的 有 效率 . | 


We FT, : 过 加 的 检验 问题 . 设 X ，…,X, 是 简 


单 随机 样本 ,很 日 然 想 到 ， 当 S= 世 太 小 时 应 拒绝 互 。. 对 给 定 
的 cE (0,1)， 设 - 是 满足 下 式 的 最 大 整数 


二 Ce LA 人 
UL 人 bp 一 ~ 人 (7 NUe W7 
力 之 力 0 
Ti-TDoDB Da 人 人 目 mv 工 昌 7A AN\ 7 计 
本 了 了 有 L 订 pp 和 正 L 上 有 下 和 外 正信 
P，(S 委 c) 委 ao (6. 7) 
了 人 一 ~ -十 洼 上: 三 
拓 镍 人 休 六 可 所 CC 其 公认 有， 交 和 赴 妨 民 小 从 让 州 全 5 下 朋 
N 0 、 
发 生 . 仿效 前 一 检验 问题 的 处 理 方法 , 设 样本 值 是 袜 ，…zn， 令 


8 二 》 忆 . 不 难看 出 mw<c 的 充 要 条 件 是 Pu (S<s)<o, 即 


6 一 加 7) <ec 
这 等 价 于 


>，Cipi(1 一 加 ) 呈 1 一 oa 


1 一 50 十 1 
设 方 程 
开 
SN， ii， ivr3 人 一 了 3 AAA 间 DA 
UnDp(A LI 一 D) 一 上 一 a 《0. oO) 
:一 50 十 ] 


的 根 为 (so)， 于 是 % 和 c 的 充 要 条 件 是 加 (Cs ) 委 加 .所 以 , 当 且 
仅 当 zx) 委 zz 时 应 拒绝 五。 :2 之 如. 

怎样 计算 如 (so ) 呢 ? .从 (6.8) 看 出 , 如 (so) 是 贝塔 分 布 BCzi 
5 十 1,2 一 %0) 的 1 一 a 分 位 数 , 于 是 





本 和 
0 
\、 So 十 1F_ (2(0so 十 1)， 247 一 50)) / 
六 团 尼 7 \ 有 利 . 帕 HHE 上 7 占 性 AN ] 司 AN An 涛 fr 7 
过 主人 人 1-o\ 人 7 12 7 下 月 国 色 和 E 7 9 72 有 此 分 了 HH ES CC ATAJJ PLAN 区 
看 (4. 28) )， 


吾 


， P，(S>c) 瓜 


水 平 x，, 应 取 最 大 的 整数 c 和 和 最 小 的 整数 c: 满足 : 
下 (SR 过 


天 下 琴 八 司 | 把 “加 也 权 如， 

寻 。 丰 二 一 检 入 臣 4 个 . 
外 CN 霸 \- 人 上 区 | Au 《 项 | 
汝 二 汪 仆 二 
2 cs 和 | 个 冲 忆 羡 SS 

5 六 多 癌 全 灯 


> 
一 一 
~ 
一 一 
0 一 2 
上 本 
9 二 
/AN 了 
-J 思 jj 
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| 
HH 
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从 伯 努 利 分 布 ,P(X=1) 王 加 王 1 一 PCX 王 0) ,PC(Y 
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绝 
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瑟 
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人 AL 


An 


8 不 难看 出 ”30、、(C1 的 欧 
户 0 
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大 在 
小 斑 
个 检验 问题 : 
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包 
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-全 

2 

> 地 

aa | 

哲 

二 

H 忆 

多 

2 9 
二 泪 
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要 

o 人 

仅 : 
. 这 时 检验 水 平 不 超过 
是 


Zl 
< 一 
~ 
志 二 
儿 

参 

?1 
二 / 

】 

且 
可 
订 
大 | 


Eap ea 和 9 | N 要 
济 皇 [ 人 阅 和 过 区 
| 汪 人 ] “ 3 人 光 站 (人 os < 
>? 心 三 n SN 六 挟 - 证 
3 六 导 间 和 个 汪 本 全 全 进 只 站 
= 4 q 革 过 二 古 
宁 不 二 号 NS 开 aaa [和 - (人 可 记 
二 am 址 四 六 下 民 和 人 知 生 和 
人 全 了 
。， 信 刚 惕 站 V/ 入 | PC < c 国 和 
、\ 人 六 所 生 站 旦 

3 6 


《0) 万 。: 轧 


这 里 刀 ,是 零 假设 , 刀 。 是 备 择 假设 . 
到 
是 大 样本 情形 才能 用 的 近似 方法 , 另 一 是 Fisher 精确 检验 


值 
Zoo 时 应 拒绝 互 。 : 力 

在 
简单 随机 样本 太 ，…,Y， ,考虑 下 列 
种 情形 下 都 可 以 用 ,但 计算 上 比较 复杂 . 


比 
拒绝 百 。:z 


Ne 


2 


而 二 人 大 


RE (6. 10) 
人 /元 人 (1 一 旋 ， ) 


= 一 全- 2 全 (6. 11) 
| 一 力 (1 一 方 ) 十 一 为 (1E 一 方 ) 
V 11 7L2 5 


人 (6. 12) 
ES 





数学 上 可 拟 证 明 , 当 mm 和 相当 大 (一 般 要 求 站 加 (1 一 总 ) 之 5， 
zzzp:(1 一 加 ) 之 5) 时 ,随机 变量 上 近似 服从 标准 正 态 分 布 . 给 定 检 
验 水 平 w, 设 *. 是 标准 正 态 分 布 的 分 位 数 , 则 P(e>z-。) 二 a. 易 
知 在 委 思 的 假设 下 .和 7 更 有 已 7 人 >2-o) 委 王 (>> 壤 -o) 二 w. 于 
是 人 >z-。 时 拒绝 再, :加 委 加 ; 当 7TK=-: 时 不 拒绝 互 。. 

拓 伐 地 ,在 方 全 思 时 ,7 从 而 7 天 z JS 大 
是 当 是 仅 当 7<z 时 拒绝 囊 。: 思 之 户 ， 

可 以 证 明 ,在 加 = : 的 条 件 下 ,只 要 mm ,ms 相当 大 (一 般 要 求 
mp (1 一 加 ) 之 5,7zz 罗 (1 一 访 ) 之 5), 统 计量 5( 见 (6.12)? 近 似 服 
从 标准 正 态 分 布 , 从 而 PC|85|>z sy) 主 c。 当 且 仅 当 | 引 盖 二 -时 
拒绝 互 。 :加 一 力 :. 

例 6.2 研究 口服 避孕 药 对 年 龄 在 40 至 44 岁 的 妇女 心脏 的 
影响 、 收 集 的 资料 表明 ,在 5 000 个 使 用 口服 避孕 药 的 妇女 中 三 年 


rm LI TI HH AS6ZPEUA-A 19 上 me -1 An 个 不 使 用 喇 遇 by 10 7 由 
内 出 现 心 瞧 鳃 死 的 有 1D /3 IN LVUUUV 1 Ah 八 有 攻克 上 有 人 一 和 J 有 J 


妇女 中 三 年 内 出 现 心 肌 梗 死 的 有 7 人 . 试问 :口服 避孕 药 是 否 对 


。 4 。 


妇女 的 心脏 有 显著 的 影响 ? 

解 ”用 六 表示 年 龄 在 40 至 44 岁 的 妇女 由 于 口服 避孕 药 导 
致 三 年 内 出 现 心肌 梗死 的 概率 ,表示 这 个 年 龄 段 的 妇女 不 服 这 
种 避孕 药 但 在 三 年 内 出 现 心肌 梗死 的 概率 . 我 们 要 检验 的 假设 是 
互 , :六 一 如， 备 择 假设 是 瓦 。: 轧 羡 力 :. 


使 用 统计 量 (6. 12) ,现在 











2 5000， 产 ”10000 
、_ 13 十 7 
! 15000 


由 于 ma 加 (1 一 力 ) 一 6. 66 过 5,72 罗 (1 一 加 ) 一 6.9955. 故 可 用 正 
态 理论 检验 法 . 可 计算 出 5=3.01. 设 检 验 水 平 <=0.01, 查 表 知 
z1-ys 一 zo95 一 2.58， 既然 5 一 3. 01 之 2. 58 , 故 应 拒绝 媚 。 :加 一 加 ， 
即 可 认为 口服 避孕 药 对 40 至 44 岁 的 妇女 心 胜 有 显著 影 啊 . 
现在 来 介绍 Fisher 精确 检验 法 此 时 对 样本 量 无 任何 限制 . 
先 介绍 操作 方法 ,然后 介绍 这 个 检验 法 是 基于 何 种 统计 思想 推导 
出 来 的 ， 仍 设 Xi ，…，X,， 是 第 一 个 恕 体 的 简单 随机 样本 ,Yi ，…， 


Yu。 是 第 二 个 总 体 的 简单 随机 样本 ,如 和 思 分 别 是 两 个 总 体 的 参 


r ， nn ， 尼 十 六 n 有 S 所 -， LTR 人 JE -页 上 上 
久 9 大 1 TH 2 人 小 作 ， 91 一 人 避 一 人 ; 以 [4 人 是 
1 
本 值 分 别 是 妇 ，s za 和 因 和 六 ， 信 
器 上 
5 一 》i， 吕 一 史 一 训 十 一， (6. 13) 
1 
为 了 检验 克 。 : 力 委 加 ( 备 择 假设 是 五 。: 过 加 ) , 令 
zi(s) 一 》 力 (1)， (60. 14) 


1 之 5 


(1 
人 
人 (G 一 0,1，…) (6. 15) 
人 和 
AN 有 / 
对 给 定 的 检验 水 平 w, 当 且 仅 当 广 (3)<e 时 拒绝 瓦 : 广 雪 户 . 
为 了 检验 矶 :加 过 加 ( 备 择 假设 是 五 :加 < 加 )， 令 
ja (中 ) 一 之/ 户 () 《6. 16 ) 
is 
(5 之 定义 见 (6. 15)). 对 给 定 的 检验 水 平 x, 当 且 仅 当 加 Cs) 去 


5 时 拒绝 本: 轧 之 记 。 
“为 了 检验 媚 , :zi 一 因 ( 备 择 假设 是 瑟 ,: 力 于 加 )， 令 
力 。 (3) 一 2min( 》1 方 ()， pbGD)T (6. 17) 


人 
i<5] 和 全 


则 对 给 洽 定 的 检验 水 平 ax，, 当 且 仅 当 (51)<a 时 拒绝 万,: : 旋 ; 一 力 :. 
上 述 检验 法 就 是 Fisher 精确 检验 法 ,其 中 “精确 ”二 字 的 含义 
是 ,这 个 检验 法 的 检验 水 平 保证 不 超过 给 定 的 w. 复杂 之 处 在 于 要 


计算 各 个 [一 二 人 算 时 要 利用 下 VAN、 人 
"天 -他 力 (z ) ,在 实际 站 并 女 小 JJ 上 j 递 推 关 系 式 : 当 忆 \ 7 一 


时 有 
= z) (一 7) 
四 1( 玉 一 杆 计 ] 


这 个 关 素 也 相模 站 的 定 立 其 由 了 栓 评 走失 立户 而 还 
过 -大 未 世人 唐 护 P II 征 六 全 散 是 炙 肌 记 . 旧 轩 示 女 诈 


工作 中 采用 的 列 联 表 变换 法 ,用 于 计算 所 有 的 户 (2. 

现在 问 : 上 述 Fisher 精确 检验 法 是 基于 什么 统计 思想 而 导出 
的 呢 ? 沿用 前 面 的 记号 ,数学 上 可 以 证 明 , 如 果 假 设 瓦 。 :加 委 z 加 
成 立 , 则 在 Si 十 S$: = 上 的 条 件 下 ,Si>c 的 条 件 概率 的 最 大 值 是 


0 (6. 18) 


王 人 介绍 和 等 际 
下 关中 


yp GD ， 即 


2 一 ( 


由 (，) 就 是 组 合 数 Ca ;一 或 ;<0 时 规定 ( 一 0. 


sup P，，(S>c 1S， +S: 一 1) 一 2 (6. 19) 


六 委 思 ， 


这 里 PP， (AS， + S, 一 上 表示 两 个 总 体 的 参数 分 别 是 力 ; ,。 时 在 
9 十 S: 一 上 的 条 件 下 事件 A 的 条 件 概率 ， (2) 的 定义 见 (6. 15)， 


A A JAVAe kPa、 RAR 本 /人 屡 z 一 六 1 、\L 、 旧 yt 毕 口 
《DOD。1 交 由 由 畦 子 王 攻 斌 基 ， 人 入 全， 2 昌 A 和 所 QU LI 以 5 和 自 人 岗 凸 
mi 和 
之 (入 的 最 小 整数 . 则 在 S: 十 S: 一 :的 条 件 下 S; 三 < 时 应 拒 
绝 万 , ;站 去 关 .注意 ,根据 样本 值 了 从 (6G 13) 
一 2 本 ”9 汪 m , y1y。 yn ? /NAN\V。 LDL/ 
知事 件 “S, 十 S: 一 妃 已 发 生 , 而 “S;  c” 当 且 仅 当 中 之 时 发 生 ， 
显然 3 过 < 的 充 要 条 件 是 加 (45s1) 委 w% (参看 06. 13))， 故 当 且 仅 当 
四 (3 委 c 时 拒绝 五。 : 力 ; 委 - 思 2 这 时 检验 水 平 不 超过 Q。 
类 似 地 ,数学 上 可 以 证 明 
_sup PP (SisclS 0 戌 这 SS 
轩 2 ;+z 0 、 
给 定 cE (0,1D): 设 。 是 满足 2pG < 的 最 大 整数 ， 从 
(6. 16) 知 号 雯 < 的 充 要 条 件 是 s(s) < 故 当 且 仅 当 思 (3) 二 
“时 应 拒绝 瑟 。: 思 > 妨 . 这 时 检验 水 平 不 超过 a 
数学 上 可 以 证 明 ， 


下 两 (Se | 3 十 3 一切 三 >》， 轧 (G) 


.PCS ce1Si 十 S: 一 外 一 > 力 ( 介 


:一 C? 


取 最 大 的 整数 c 满足 > 2(D) 生 34, 再 取 最 小 的 整数 c 满足 


271z(GD 委 了 . 则 在 再,: 包 一 轧 成 立 且 S, 十 S: 一 上 的 条 件 下 事件 
“Si<a 或 Si>ca” 的 条 件 概率 不 超过 可见, 在 S, 十 S: 一 :的 条 件 


委 了 4 了 4 时 


串 工 工 


下 91 入 ci 或 1 之 Co 时 应 拒绝 万 。 : D1 一 D2. 根据 样本 值 到 9 下 及 
灿 2 积 (6. 13) 知 “S， 十 一 万 已 经 发 生 , 故 5 < C1 或 31 之 cz 


0 


S1 


< 十 一 户 A 订 


ie 上 了 全 
了 时 以 臣 芭 io:Pi 一 Do. 亚 ; 


站 
人 


C1 


4 之 cz 的 充 要 条 件 是 . 2 pi) 委 c. 故 从 (617) 和 类 加 Ca) 委 c 时 拒 


0 
一 51 


交 所 : 记 一 疙 这 时 检验 水 平 不 超过 w- 

以 上 叙述 了 导出 Fisher 精确 检验 法 的 统计 思想 下 面 介绍 实 
际 工作 中 采用 的 用 于 计算 所 有 2 为 (的 具体 方法 . 先 引进 一 个 定 
文 对 给 定 的 mn 972 和 刀 见 (6. 12) ) ， 称 非 负 整 孝 组 成 的 矩阵 


人 


\c dl/ 
目 He 让， 二 和 局 和 re 十 闪 
是 家 取 的 ,在 aa 十 三 1，c 十 dd 一 7 QT 十 Cc 一 夺 普 然 * 理 皮 卫 由 其 左 
上 角 元 素 a 唯一 确定 . 左上 和 角 是 a 的 阵 称 为 a 阵 , 用 轴 . 表示, 显 
然 ,五 
/QQ 0、 
4. 一 | (0 之 1 ,5C 之 1 ) 
CC CI/ 
则 
/Q& 十 1 0 一 1 
CT 
从 (6. 18) 知 
和 pc 
No (6. 20) 


(6. 20) 比 (6. 18) 的 好 处 在 于 :公式 好 记 . 


从 六 (的 定义 ( 见 (6.15)7) 知 , 当 守 不 满足 下 列 不 等 式 (6. 21) 
时 ,z(G) 王 0. 
1 < (6. 21) 
这 里 
7j 一 max(0 7 一 上 ， 7M 一 min(C7l yt) (6. 22 ) 


先 依 次 列 出 AAA, + ，…，4… ,然后 计算 请 (xx ), 再 利用 
(6. 20) 逐 次 计算 加 (mo 十 1)，…. .当然 ,对 于 检验 五: 加 委 如 只 需 
列 出 A。,A。+，…，A4A…， 计 算出 相应 的 训 (3)，z(s 十 1)，…， 
(2” )3 对 于 检验 Hi :bz 之 如 ,只 需 列 出 A，,A,， + ，… Asi 计算 
出 祖 应 的 (mo) , 户 (m 十 1)，…， 方 (s  )， 

本 3 某 公 安 局 有 两 个 刑侦 组 ,在 过 去 一 年 内 第 一 组 接手 


25 件 人 命案 ,结果 侦破 了 23 件 ; 第 二 组 接手 35 件 人 命案 ， 结果 侦 
破 了 30 件 ， 问 ， 两 个 组 的 侦破 能 力 有 无 差别 ? 


解 议 两 个 组 的 侦破 率 分 别 为 思 和 思 , 要 检验 的 假设 是 

万 ; ]; 一 ]， (六 里 设 允 普 都 且 一 值 随 机 恋 县 w 一] 去 示 秘 各 

e。 AL 忆 2 。 Ja 一 浅 六 入， 具 P 人 二 一 一 [LEL 人 尼 机 疏 量 ,和 二 WEs /本 了 一 口 
侦破 成 功 ,X=0 表示 未 能 侦破 ;Y=1 表示 第 二 组 侦破 成 功 ,Y=0 

寺 示 二 能 人 傣 了 和 一 Dr 一 1 二 DIV 一 1T\\ 和 御 人 了 环 昌 五 :~ ~- 

和 东 钞 泵 用 PN 化 人 人。 | 人 L 二 7/ 9 三 2 同人 十 上 7 / 可 和信 省 J 个 大 国 了 人 人心 上 【< 


精确 检验 法 . 现在 7 一 25,72 一 35,51 一 23， 95 一 30， 1 一 53( 人 参看 
(6. 13)). 从 (6. 22) 元 0 一 072 一 25, 从 (6. 17) 双 


23 29 


z 加 (2 ) 一 2min( 之 / 访 ()， >》 DG) ). 


1 一 23 


从 (6. 15) 知 训 (23) 一 0. 252 ,从 (6. 20) 知 








(24) 一 沪 (23)502e 一 0 105 
1] 广 29 
思 (25) 一 妨 (24) 元 一 0. 017 
村 是 
yp) 一 0 374 ， 
23 
之 1 力 ( 一 1 一 2/zG) 十 加 (23) 
;= ;一 23 
=-1 一 0.374 十 0.252 一 0. 878. 
从 而 


1 
从 


力 3 1 
于 是 在 检验 水 平 =0.05 下 不 应 拒绝 再, :2 思 一 ，. 换 句 话说 ， 没有 


。 了 40 。 


理由 认为 两 个 组 在 破案 能 力 上 有 差别 . 


8$7 拟 合 优 度 检 验 


一 个 总 体 的 分 布 函 机 


十 
和 


站 识 可 以 给 予 回 答 但 是 在 很 和 多 情况 下 ， 只 能 从 
] 。 4K 2 坟 LLU 1 月 蕊 / 


去 发 现 规律 ,判断 总 体 的 分 布 是 什么 生子， 这 就 是 所 谓 的 执 


开 
人 


相 禹 其 
冰 于 下 


一 般 而 言 ,总 是 先 根 据 样本 值 ( 一 批 观测 数据 ) 用 第 二 章 中 介 


绍 的 直方 图 法 ,推测 出 总 体 可 能 遵从 的 概率 分 布 ( 或 密度 函 数 ) , 然 
民生 逢 | 用 本 节 所 讲 的 方法 来 检验 该 总 体 的 分 布 师 数 是 否 真 的 就 是 


给 出 的 基数 . 下 面 先 介绍 好 检验 法 ， 然后 介绍 柯 氏 检验 法 和 其 他 


一 “起 


检验 法 . 


函数 Fu(z)( 即 满 

不 壮大 这 续 日 im 严 (7 一 1 im 下 rr)y 一 0 我 们 本 和 研 9 的 

1 8 门人 -一 大 工 LLLL < 0、 7 二 9》 OO vv“79TNTNHJ 231IALHA 
工 一 > 口 〇 六 一 一 口 必 


检验 问题 是 : 
万 。 .站 ( 工 ) 三 太 (六 )<> 万 ， .下 (并 ) 丘 。 ( 工 ) 
X 检验 法 可 叙述 如 下 : 设 Xi ，…，,X, 是 来 自 X 的 样本 . 在 实 
轴 上 取 六 个 点 :po 妈 (< 去 帮 志 < 拖 寻 )， 于 是 把 实 轴 分 成 


@ 车 在 假设 苹 成 立 的 条 件 下 总 体 的 分 布 函数 是 完全 确定 的 , 则 称 品 。 是 简单 
假设 ;反之 , 称 是 复杂 假设 . 


m 十 1] 段 ,第 1 段 是 (一 ce 当 ], 第 2 段 是 (二 , 刀 ]…，, 第 冯 填 1 段 是 
(如 yco). 用 六 表示 本 … ,入 ， 中 落 人 第 守 段 的 个 数 (一 1， 四 抽 


7 十 1) ,一 -是 频率 . 用 力 表示 X 的 值 落 入 第 段 的 概率 . 如 果 万 。 


成 立 , 则 刀 ; 是 可 以 算出 来 的 ,事实 上 ， 


万 ; 二 己 ( 人 魏 三 ) 一 下 (三 ) 
太一 下 < 和 妥 雇 ) 一 上 (起 ) 一 FI) (< 过 2 委 77) 
万。 三 忆 (A 人 天) 一 1 一 下 (人 ) 
根据 概率 与 频率 的 关系 知 , 如 果 万 。 成 立 而 且 盖 又 比较 大 , 那 
么 六 与 户 差不多 ,就 是 说 ( 兰 二 户外 应 该 比较 小 ,于 是 
天 \ 3 
一 一 八 7 2 轧 


应 该 比较 小 才 合 理 ， 这 是 因为 六 起 了 平衡 作用 .对 于 很 小 的 包 
而 言 , 即 使 ( 兰 一 访 ) 很 小 , 兰 与 轧 也 可 能 相对 误差 很 大 ， 因 此 


(和 一 名 ) 1 是 用 来 刻画 一 与 如 , 接近 程度 的 量 . 


我 们 就 取 V 作为 统计 量 . 由 于 样本 Xi ，…,X, 可 以 看 成 随机 
变量 ,所 以 


褒 Nb (7. 1 
富 77 力 ， 
也 是 随机 变量 . 
经 过 数学 方面 的 研究 ,可 以 证 明 ( 本 书 从 略 ): 在 五。 成 立 的 条 
《上 下 -大 
ff 1 


lm PCV 委 工 ) 一 | Sm(《y)dy 


这 里 gw(?) 是 疡 个 自由 度 的 X 分 布 的 密度 函数 ， 换 名 话说 ,在 玖 
下 ,VY 近似 服从 X。 分 布 . 给 定 wE (0,1) 查 X 分 布 表 ,可 找到 》 使 


了 4 全 


”Do ” 


| gdy 一 a 


9 
sj/ 入 


于 是 PCV>A|Hu) 一 ,Hi 的 否 宗 域 为 机 ,=={V 之 1}. 即 根据 样本 


值 过 1 5 ”””3》 尼 m 计算 出 5 | 就 拒绝 五。 :了 上 了 (Z) = 了 。 (z) ;在 V 委 
和 就 接受 九 ,. 
直 人 上 二 二 矿 下 一 rm 有 
二 偿 刀 从 听 征 看 名 的 《4 亿 拖 和 汉 *， 左上 .上 earSon 丁 LUU 和 十 
提出 的 在 实际 使 用 时 如 何 选取 和 及 分 点 z1 9， 91 办 咏 ? 这 并 
无 芥 性 规定 .对 于 离散 型 分 布 ,这 些 数 的 选取 有 比较 自然 的 方 
法 ( 见 下 面 的 例 ). 对 于 连续 型 分 布 ,' 有 人 建议 和 使 用 直方 图 法 
6 导 形 相 人 个 本 < 一 芋 . 灿 F 乓 在 四 信 |、 上 十 全 涛 六 着 6F 契 
LU /1 上 DJ HA 7C AU/ 一 六 


z, 略 大 的 数 ,将 区 间 [a ,bm 十 1 等 分 ,可 得 分 点 二 ,各 ，… 可。 


读者 可 以 通过 下 面 的 例子 掌握 闪 检 验 法 . 
例 7.1 某 工 三 近 5 年 来 发 生 了 63 次 事故 ， 校 星期 几 分 类 
加 下 


星期 .| 二 四 五 -六 
YA 汪 f mn 1 1 1 作 1 1 吃 
{A 人 谢 久 呆 上 W 人 避 0 是 
问 ; 事 故 的 发 后 是否 与 星期 几 有 关 ? 
人 4 所 -LA- 上 、 人 一 | 一 和 门 全 。 
用 X 表 东 这 样 的 随机 变量 : 若 事故 发 生 在 星期 1 则 和 一 :, 显 
Y ATTAE 人 击 有 1 92 。。。Ar 旦 3 天 [ 姜 人 似 口 
ys LA RHJPJHREIAE L9C， 9 UN 


10,，…, 王 12 ,计算 得 V=1.67 一 11.67, 故 假设 互 , 不 能 拒绝 , 即 
和 本 期 几 有 关 


说 , 竺 检验 的 假设 是 
万 ， : PFCZ)E(EOCZ; ;CO … (人 ): 《0 0)EGO,) 
这 里 @ 是 已 知 的 集合 . 例如 要 检验 X 是 否 服从 正太 分 布 ,也 即 要 


检验 五, : Foele ( ee ) , 任 意 ,o>0 ,其 中 印 是 标准 正 态 分 


这 是 复 节 假设 的 问题 . 目 然 想 到 也 用 前 面 介 绍 的 X 检验 法 . 
要 注意 的 是 ,在 刀 , 下 X 取 值 落 和 第; 段 的 概率 记 无 法 直接 算 
出 .此 时 可 用 下 面 的 方法 

和 订 面 一 样 将 (一 co co 分 类 六 十 1 个 区 间 ( 一 co .rr |. 

H 0 ”全 人 何 下 9 /万 /这 1 下 ?之 1 jy? 
(三 加 (加 yce), 则 有 

天 YY 有 站- 全 
PINANVI， 9URA7 一 人 人 0NL1I9UI， 9UR 7 
力 i(O 0 一 了 500) 一 和 (人 30 0 
zZ 一 2 ,7171 
力 CO 0 一 ] 一 下 Cit30 0 ) 
由 样本 …,X 落 拓 六 十 1 个 区 间 的 频率 着 一 1, ,7 十 1 
1 人 1] ”人 mn 和 府 / 八 72 人 ， 1 9J 芭 


由 的 最 大 似 然 佑 计 Oo Oo ， 即 由 
Ji 1 本 … 10) 


了 (Y 门 se 门 
二 忆 必 II 9 ,0 ) 9U0， 


求 出 lo 0 , 记 
2 门 NA A/。 1 TAN 
忆 ; 一 7i\VUIo 9 ”9 / \Z 一 上 9 ”97 下 上/ 


数学 上 可 以 证 明 : 


人 


一 0 ， 7 一 上 ，,R 


机 当 Fo(。 ) 是 连续 函数 时 ， 上 述 求 0 ，…,bu 较 麻 
烦 ,而 变通 地 采用 下 述 做 法 ;假设 总 体 的 分 布 函 数 是 严 〈>， 


和 
AAA > 1 人 LA Ai 1 人 LIAN 1TER OK yj 人 HA TI I -和 作 人 [一 人 9 CCZ70 > 了 


和 ) ,样本 是 入 1， …，X,，, 首 先 用 最 大 似 然 估 计 法 找 出 未 知 参 数 


二 了 六 和 
LUU 


0 …… 的 估计 值 名 ,…, ,于 是 得 分 布 函数 Fo (zi 0). 形 
式 上 和 前 面 一 样 ,计算 加: 
力 一 下 (30 2) 
力 一 Fo 2) 一 Fo 0)， 1 一 2,3，…7 
力 ,一 1 一 下 Ci30 0 ) 


仍 用 统计 量 
< (7 一 7 力 ;) 
E 7] 


查 X，。 ,分布 表 可 找到 ) 满足 


信 


| gw)dy=a 

取 和 否定 域 丸 ,={(V>>)}) , 即 当 六 > 时 拒绝 五 ,, 当 V 委 ) 时 接受 

妃 .这样 的 检验 的 第 一 类 错误 概率 P{(V 之 | 五 o} 也 近似 等 于 va. 
例 7.2 历史 上 有 人 对 一 块 放 射 性 物质 进行 观测 ,记录 每 

20 秘 内 放射 的 ac 粒子 数 , 共 作 了 500 次 观测 得 表 7. 1 : 


表 7. 1 
放射 出 的 粒子 数 观测 到 的 次 数 
0 14 


35 
70 
105 
102 
81 
52 
23 


由 文献 知 放 射 性 物质 一 定时 间 间 隔 放 射 的 粒子 数 一 般 遵从 
Poisson 分 布 . 问 : 从 这 批 数据 出 发 能 否认 为 放射 的 粒子 数 服从 
Poisson 分 布 ? 

太 该 物质 在 20 秘 的 间隔 内 放射 出 的 ac 粒子 数 为 入 ,X 的 分 布 


三 国人 DAN\ | 
征 记 Zz) 一 上 (和 一 二 )(Zz 一 0， 1 2 )。，1] 忆 
中” 
力 ( 工 ) 人 ) 一 一 0 人 呈 0 汪 2 
| 
要 检验 的 假设 是 
有 
40s 记 \ -LN UN\L9AI7TSIAA -nn | 
竟 天 | 力 沙 担 可 失 出 1 的 明天 人 包 佬 计 类 1 一 3 8 了 7 利 力 从 王 
站 JULY AU JULU 作 有 JI / 八 1 维和/ 人 JJ。 心 小 jJ 三 La 工 N 
人 
力 入 下 (2 三 0 32， ,9 ) 
4 
Co 人 9 
ji1o 一 > ,e 1 一 上 一 忆 ; 
天 10 1 一 ( 


可 算出 o,，……,zio, 再 计算 统计 量 

CO 

2 7?z， 

这 里 是 2” 个 观测 值 中 粒子 数 恰 为 : 个 的 个 数 (0 委 ; 委 9) ,mo 是 
粒子 数 不 小 于 10 的 观测 次 数 ,可 算得 V 一 7. 275. 查 X 分 布 表 ( 自 
由 度 是 ER 05). 现在 六 一 7. 275 
<<16. 9 , 故 不 能 拒绝 五 ,.. 即 可 以 认为 wa 粒子 数 服 从 Poisson 分 布 . 


例 7.3 茶 车 间 生 产 滚珠 ,随机 抽取 了 50 个 产品 , 测 得 它们 


沁 


的 直径 为 (单位 :mm) : 
15.0 15.8 15.2 15.1 15.9 14.7 14.8 15.5 
1 
14.5 14.2 14.9 14.9 15.2 15.0 15.3 15.6 
15.1 14:9 14.2 14.6 15.8 15.2 15.9 15.2 
15.0。 14.9 1458 145 15 15.5 1155 15.1 


1 0 1 
14.6 14. 2 . 
我 们 问 :滚珠 直径 是 否 服从 正 态 分 布 ? 
' 设 滚 珠 直 径 为 尖 , 其 分 布 是 F(z), 竺 检验 的 假设 是 瓦 。: 





F(z)e i9@( -一 


仍 用 X 检验 法 . 首先 从 数据 出 发 找 出 wo 的 最 大 似 然 估 
计 是 


2 
取 罗 2 一 6, 这 50 个 数据 最 小 的 是 14.2, 最 大 的 是 15.9. 取 a 王 
14.05 ,0 一 16. 15 ,将 La ,oj17 等 分 ,得 分 点 为 三 14. 35, 刀 三 14. 65， 
国 ' 一 14. 95 ,如 生 15.25, 右 二 15.55, 上 一 15.85 ,实数 办 被 这 些 记 分 成 


了 7 段 ,利用 @(2 -375 ) 及 正 态 分 布 表 可 以 得 到 户 如 下 ， 


思 1 一 0. 041 4， 力 ; 一 0. 107 15 力 ; 一 0. 215 4 





(zz; 一 总 ) 
y- SC 一 2 1.7284 
二 71 力 


取 ax 一 0. 05, 查 X 分 布 表 ( 自 由 度 6 一 2 一 4) 得 =9.49. 现在 = 
1.728 4<9. 49 , 故 不 能 拒绝 万 ，. 

上 面 介绍 的 检验 法 称 为 分 布 函数 的 X 检验 法 ,也 称 为 拟 合 优 
度 X 检验 法 , 它 的 好 处 在 于 不 管 总 体 的 分 布 是 什么 都 可 以 用 , 因 
而 应 用 较 广 . 

(二 ) 列 联 表 的 独立 性 检验 

作为 X 检验 法 的 一 种 应 用 ,现在 介绍 列 联 表 的 独立 性 检验 . 

设 随机 变量 X 的 可 能 值 是 1,2,…,s;Y 的 可 能 值 是 1，2，…，: 
(52, 上 2). 现在 对 向 量 (X,Y) 进 行 了 7 次 独立 观测 ,发现 “X 取 
1Y 取 7 的 次 数 是 mw (一 1,2, ,5 一 1,2,，…… 划 .要 据 此 检验 下 
列 假设 : 


。:X 与 了 相互 独立 
在 这 种 问题 中 常 将 数据 排列 成 下 表 ( 表 7. 3), 称 为 * 关 上 联 立 
表 或 列 联 表 . 





记 


。 04 。 





当然 


记 
力 一 上 (和 一 1 一 1)， 2z 一 PIGA 一 1)， dg 一 上 (YY 一 7) 
竺 检验 的 假设 就 是 
克 。 : Di 一 Di9) (一 切 2 97 ) 
首先 在 互 。 成 立 的 条 件 下 找 2 9 的 最 犬 似 然 估 计 . 
注意 似 然 函数 为 工 一 ITITceey 5 于是， 


人 


jn 世 王 人 0 轧 ; 十 1 ln 9) 


~ 


一 
[C 
\c 


解 方程 组 
9inL_ dlin. 
01， 





大 似 然 佑 计 为 


了 
褒 
S 


三 7 1 7 。 由 本 = 
也 ， ee 0 (下 
AL 


《7 一 7 力 Gi) 1 力 ,9 让 
炎 冯 (7.3) 
/7 力 1G 


根据 (一 ) 中 介绍 的 一 般 理 论 ,在 五 。 下 ,V 的 极限 分 布 是 ! 个 目 由 
度 的 X 分 布 , 其 中 /一 组 数 一 1 一 未 知 参数 个 数 一 # 一 1 一 (9 十 一 2) 
一 (一 1)( 一 1D). 于 是 立 近 似 服 从 X (Cs 一 1) (一 1)) 分 布 . 给 定 


acE (0,1) , 查 X 分 布 表 , 可 找到 临界 值 1 使 PC(V 之 1)=w。 取 否定 
一 (Y 一 外 了 就 可 以 对 假设 豆 。 进行 检验 了 . 


@ 
| 
| 
| 
生 


引 理 7.1 YV 人 
v=-x( 袜 立志 二 (7. 4) 








| 
三 二 
Yr _ NSNNAWI 7: 7 \ 2 1/ 7 1 
2 
7 
SS 人 
人 1 
1 
一 1 六 (人 一 117 0 
人 个人 天 0 





证 毕 . 
二 只 AT NA 2 1 全 汪 “UV 一 人 > 
2 
U_ Ca17122 一 72127221 7) 7 RN 
了 了 


自由 度 一 (6 一) 一 TD 一 1 
全 7.4 为 了 探讨 吸 燃 与 患 慢性 支气管 炎 有 无 关系 ;调查 了 





我 们 可 以 设想 有 两 个 随机 变量 X Yy. 任何 一 企 人 ,车 他 吸烟 ， 


一 1, 若 他 不 吸烟 , 则 令 X=2, 若 他 患 慢 性 支气管 炎 , 令 Y=1， 
慢性 支气管 炎 , 则 今 Y 王 2 记 


IL - 六 -NA 忌 


四 区 用 (全 0 


我 们 来 检验 玫 

四 ;一 力 9j (一 切 本 7 ) 
根据 上 面 介 绍 的 X 检验 法 ,首先 计算 统计 量 立 ,利用 公式 (7. 5) 知 
(43X121 一 13 X162): 
56 X 283 X 205 X134 
对 cx 一 0. 01, 查 妨 分 布 表 ( 自 由 度 为 1) 知 临界 值 M=6. 63. 现在 


3 , 故 应 拒 缀 Tr7T HBH 虫 烛 性 去 生 竹 必 FI 后 在 半 
。 RA 广 上 JE- 209 UPoit 这 [HL 信 上 特 信 人 帮 / 交 门 -和 八 ， 


1 柯 尔 葛 戈 罗 夫 ( 和 oljmogorovy A N. ) 检 验 法 


前 面 说 过 ,不管 总 体 的 分 布 是 什么 类 型 ,X 检验 法 都 可 以 用 . 
不 过 ,对 于 连续 型 的 随机 变量 ,本 段 介绍 的 柯 氏 检验 法 更 好 些 . 
设 X 的 分 布 函数 (z) 是 未 知 的 ,Xi ，…,X, 是 样本 ，Fo(z) 
是 给 定 的 某 个 分 布 函数 . 我 们 来 研究 下 列 检验 问题 : 
万 , ;FF(z) 三 已 CCz) 志 万 :FFCZ) 六 下 (zz) 
首先 从 样本 出 发 求 出 经 验 分 布 函数 F, (z) 如 下 : 


r 和 一 了 
V9， 立 二 全 (1) 


一 339 一 7 _ 48 


直 区 


检 
\ 


机 四 委 ZI<<AeD (R 二 1 2 一 二 ) 


网 芋 之 入 on 


了 田 W 和 < 了 OA 自古- 小 ea 了 人 从/ 八 到 - 姑 的 二 并 上 
da 一 Lo) 《nn /人 11 六 人 《AL 9 9 < 人 AP AN JJ 工 J HHJ 攻 JP。 
计算 分 歧 度 


疡 ,一 sup | 忆 (z) 一 FoCz)| 


一 ce < 工夫 co 


招 梯 本 于 成 随机 杰 旦 刚 站 且 顺 机 变 全 一 这 到 TB 4 1] 
Ji 人 月 凡人 和 1 福星 ?人 JJ 二 和 是 下 作文 星人 从 而 一 衬 丰 证 下 上 


(Glivenko - Cantelli 定理 ) 知 ,如果 万 。 成 立 , 则 P(lim 忆 ,一 0) 一 
换 句 话说 ,如 果 互 , 成立 ,而 又 比较 大 , 则 也， 的 值 不 应 该 太 大 . 
二 


四 出 万 《十 一 一 一 虽 Fm 2 TRR 忆 z T7 FE mA Rh FI HH 
上 RH -和 丰 也 ， HHJIANLR ANNA DA LALLO。 [1 否定 用 二 入 
全 ,一 (有 也， 人 (7.0) 


给 定 wcE (0,1) 后 ,应 如 何 取 \) 使 样本 落 和 人 多。 的 概率 为 w? 这 就 涉 


。 157 。 


及 到 如 何 求 出 也, 的 分 布 . 下 列 引 理 告 诉 我 们 ,, 的 计算 公式 相 
当 简 单 ,而 且 当 Po (Cz) 是 连续 范 数 时 也, 的 分 布 与 Fu(z) 无 关 . 
引 理 7. 2 








民 | 
D,= maxmax| 一 0 ) (7.7) 
1 雪上 委 ) 1 77 / 
人 。 。 有 全 -和 YY 全 一 和 人 一 了 各 ti _ 一 全。 全 
而 且 如 果 Fo(z) 是 连续 郴 数 ,zl,，……，,z, 是 来 自 Fo(Cz) 的 样本 , 见 
忆 )， 的 用 布 与 oz) 无 
下 站 人 4 An 
、 d d d 
UL AJ 一 人 L .LO) 9》v《(P 十 ]1) 9 县 OO 以 L/ 二 刀 疏 /7 
0. 则 
记 一 mnasi 全 [| 有 vv 五 7 | 
7 Ia 区 SUb | 三 之 7/ 人 0\ 之 /| 
0 甩 ” xzE [zz ) 
人 
是 旺旺 世上 L 了 有 上 上 且 蕊 有 < 二 < “人 上 到 ) 7 三 呈 有 Ne 人 (到 ) MA 太 
1 委 4 坟 7 \ 7 ， 1 1 
> 证 HRIT7 7Nrh 司 人 NA 在 bp 二 TY 矿 TI 
和 过 从 用 (1 /人 AL， 行 二 ON/ 二 <? 人 JJ 人 0N\ -17 9 人 


相互 独立 ,都 服从 [0,1] 上 的 均匀 分 布 ,而 F(Cz) 和 FCz ) 扫 … 
它 


\、 目 TD 人 AAA -AP Re OO 1 已. 人 下 TEL 人 AN -zy 人 YY 二 
< Fo(Czo ) 是 均 二 刀 人 网 人 从 下 区 上 门 昌 怀 唱 刀 人 元 王 饮 雪 
可 分 布 确定 ,与 Fu(Cz) 无 关 , 从 而 也 ,的 分 布 与 Fo(Cz) 无 关 


有 复杂 的 表达 式 , 当 7 不 太 大 时 ,万 的 分 位 数 


一 “了 的 分 布 1 一 | 一 一 -人 表 已 
造 好 , 见 本 书 附 表 7; 当 半 很 大 时 ,需要 利用 也, 的 渐 近 分 布 . 柯 氏 
在 1933 年 证 明了 下 绚 次 人 [的 杉 限定 理 
FL ~ JJ A JJ 上 JUN ULTS AN 人 "一 。 


lim PCvVnD, 委 z) 一 QCz) (一 切 z) 


rr_ FRI 
了 公主 
《一 工 ) 一 CR 工 莹 盖 0 
[0 ， zx0 
六 个 定 利 的 证 朋 相 汝 长 轨 由 了 了 本 齐 程 的 藻 力 这 雪人 傅 委 立 
也 和 十 坟 有 开外 桔 放 ，ABEL JJ 人 中/ 和 有 “2 纱 骨 人 


从 这 个 定理 知道 ,只 要 瓦 , 成 立 ,m 又 比较 大 , 则 VzD, 的 分 布 
近似 地 就 是 Q(Cz). QGCz) 的 数值 已 造 好 了 表 , 给 定 wE (0,1)* 可 查 
表 找 到 1 使 

P(CD, > 人 二 PoD VD) 
>z1 一 QCvVnzAu) 一 a 


(在 附 表 7 中 对 w=0.05,0.01 给 出 了 大 的 值 )， 否 定 域 是 


Wu, 一 (D, 之》) 
上 述 方法 就 是 著名 的 柯 氏 检验 法 . 
例 7.5 一 批 小 动物 体重 为 (g): 
356.4 362.5 394.7 356.0 387.6 
305.1 “385.1 383. 2 346. 6 314. 2 
394.8 370.7 370.8 434.2 365. 2 
377.1 365.9 384.4 297.4 404.3 
“412.0 349.1 344.5 


试用 柯 氏 检 验 法 检验 这 批 资 料 是 否 符合 N(370. 6,(29. 1)2)(e 二 
0. 05). 

设 FE (Cz) 为 N(C370.6,(29.1)27 的 分 布 
可 以 算出 卫 ,=0. 104, 对 a=0. 05,2 一 23, 可 找到 痢 
0. 275 ,现在 D,=0.104<0. 275 故 可 以 认为 这 批 资料 
(270. 6 ,(29.1))，. 

要 注意 的 是 ,车 下 (z) 的 表达 式 中 含有 


一 VE 人 一 7 了 7 


法 不 能 直接 用 . 实际 工作 兰 往往 从 样本 出 发 找 出 未 知 参数 的 最 大 他 
然 佑 计 值 ,代入 PCz) 的 表达 式 , 从 而 得 到 确定 的 分 布 图 数 , 再 计算 
分 歧 度 D,, 仍 采用 上 述 的 柯 氏 检验 法 进行 检验 . 这 是 一 种 近似 处 理 
法 . 此 时 ,vVzD, 的 极限 分 布 是 否 仍 是 上 述 的 QCz) 就 不 得 而 知 了 . 

关于 分 布 拟 合 的 检验 ,还 有 许多 别 的 检验 法 . 比较 着 名 的 有 
Cramer -Von Mises 检验 法 (1936). 它 要 检验 的 假设 是 五 ,， ;下 (7z) 
二 忆 Cz). 取 统计 量 


取 ? 一 直 [PFCz) 一 Fe(z)]dFoCz) 


| 


这 里 有 (Cz) 是 汪 …X。 的 经 验 分 布 冰 数 ,积分 是 Stieljtjes 积分 ,万 

征 一 种 加 权 平 均 . 显然 ,如 果 球 . 成 立 12 又 比较 大 , 则 丈 应 该 很 小 ; 

反之 奉 克 ”相当 大 , 则 应 否定 了 于. 故 否 定 域 应 取 为 :Wo 王 {( 克 > 人 )}. 
经 计算 知道 ,W ”有 下 列 简单 公式 : 


本 
-12 < 人 L 27 j 





【1 < AAA 一 了 局 nm DC Nipt TT rr 站 TIr2 山上 /AN -大 上 
从 过 人 小 人 到 有 轴 : 刘 林 了 上 okZI) 坟 纤 ,1 有 克 羡 , 烛 内 的 分 人 
7 咏 
Fu(z) 无 关 . 当 ? 很 大 时 ,也 可 找 出 友 : 的 近似 分 布 ,因而 也 可 找 
出 临界 值 ， 
所 村 扩 枪 检 涛 米 个 我 们 顺便 从 绍 一 下 Sirnnv 的 酷 样本 
可 JJ IAA 人 JIAANL AI 一 上 上 v7L LELLELIY 下 人 


都 是 未 知 的 连续 函数 . 研究 检验 问题, 


万 ， ;下 (六 ) 王 下 人 中 主 下 《> 
站 中 0 3 于 7/ 2AN- 7/ 是 匡 O 2 站 ] 和 7 一 和 三 2 NA 7/ 
议 了。 (Zz) 是 从 1 六。 的 经 验 分 布 郴 数 ,C YY 的 


LXTA AN -< 米 赤 
< 区 /JRN 双人。 立 


友 0 一 SUDP 下 (Z) 一 (Cn， (人 并) 
可 以 证 明 :在 互 。 成 立 的 条 件 下 ， 


。 7121 7 
lim 三 { 2 <z|j= QCz) 
许 、 一 w O 〇 17 17 1 ”2 

1 1 2 
2 OO 


其 中 站 人 和 8)、_ 
给 定 cE (0,1), 取 否定 域 


1 一/ 门 SS 
必 0 一人) 
有 


其 中 可 查 表 得 到 . 


/ rn we 
9 / 正 态 性 检验 


在 实际 工作 中 常常 需要 检验 一 个 随机 变量 是 否 服从 正 态 分 


布 , 这 叫做 正 态 性 检验 . 上 面 介 绍 的 X 检验 法 、. 柯 氏 检验 法 等 当然 


了 六 


” [OU ”， 


醋 以 使 用 ,但 是 上 述 方法 由 于 是 通用 的 , 故 有 针对 性 不 强 的 缺点 . 
对 一 些 特定 的 分 布 往 往 可 以 找到 针对 这 类 特定 分 布 功 效 较 高 的 
检验 . 正 态 性 检验 的 方法 有 很 多 种 ,经 过 国际 标准 化 组 织 (ISO) 统 
计 标 准 分 委员 会 的 研究 ,最 后 认定 Wilk - Shapiro 的 殉 检验 和 


D Agostino 的 也 检验 是 最 好 的 ,它们 犯 第 二 一 类 错误 的 概率 最 小 . 
该 委员 会 站 世界 各 国 推荐 使 用 这 两 个 正 态 性 检验 方法 . 我 国 已 把 
这 两 个 方法 列 人 国家 标准 ,编号 是 GB 488 一 85. 下 面 介绍 这 两 个 检 
验 法 . 当 样 本 量 nm<<50 时 用 人 检验 ， 当 样本 量 7 之 50 时 用 亡 检验 . 
(1) 网 检验 (ms50) 
对 于 检验 问题 


人 


刀 , ;X 服从 正 态 分 布 人 > 瑟 . ;:X 不 服从 正 态 分 布 


到 统计 量 
和 全 本 这 
QA (和 or 一 从 | 
和 (7. 9) 
> (Xe 一 台 ) 
其 中 XoD 委 Xo 委 … 委 Xw 是 样本 XI，…X，。 的 次 序 统计 量 , (ax) 
是 一 组 特定 的 值 * 可 从 特制 的 表 中 查 得 . 
克 检验 的 否定 域 是 
克 。 一 ( 克 < 《7. 10) 


其 中 、 满足 书 ( 泵 < 五) 一 w. 

当 样 本 量 *” 委 50 时 ,国标 附 有 相应 的 (as ) 的 值 以 及 一 0. 01， 
0.05,0. 10 时 和 的 值 . 

这 一 检验 法 的 理由 大 致 如 下 : 


设 1，…， 入 ， 独立 . 同 分 布 , 均 服 从 Non) 则 一 


一 一 4 独立 同 分 布 , 均 服从 N(0,1) 令 世 2 民权 


ER ”9 7 是 确定 的 数 ， 与 wa 无 天 . 显然 


*。 了 01 。 





入 一 /十 072; 十 ei， 注意 半 较 大 时 ,和 po 羡 达 Xe ,因而 es: 很 小 . 这 表 
明 个 点 (Xe ,mm )G=1,2，…, 四 近似 在 一 条 直线 上 

:怎样 判别 个 点 是 否 近 似 在 一 直线 上 呢 ? 可 用 下 列 统计 量 ， 

| 2CXoe 一 下 (一 加 1 和 

忆 (元 = 二 >m) 


J/ 立 Cxe 一 叉 ); on 一 力 ); | 


在 刀 。 下 ， 即 诸 X; 服从 NCusoz) 时 民 接近 1( 见 第 四 章 ). 可 


站 一 YY 殉 / 荆 1 9 二 FA 了 7 
~ 人 AN\ ji 了 /小 二 7/ RHJ AAA 于 LO。 








-AL 八 J 
由 于 N(0,1) 是 对 称 分 布 , 所 以 (YYy,) 与 (一 了 ，…， 
一 ) 有 相同 的 联合 分 ,从 出 了 楚 一 寺 二 和 同 分 布 ， 下 1] 一 
772 十] 一 上 (&R 一 ]， ,7) ,7 一 0, 于 是 
了 \2 
(> 和 om ) 
尺 “ 一 / ti 一 ] 
NA AN 、 2 
/人 八 人 人 ( 人 /0 
;一 ] 、 ii=] 
太刀 攻 
[ 臣 、 遇 
| 它 ” 7ret to 一 包 ) 一 从 0 四 
& 一 1] 
SS 二 
;一 ] ;一 ] 
今 
IN 一 
LL 一 
(二 me) 
;一 ] 
即 得 玖 一 R2. 


1 于 证 矿 一。 上 一 站 TH 
可 见 , 及 用 否定 域 驳 , 三 {( 允 < 人 /是 有 道理 的 . 


当 ?” 盖 50 时 ,采用 下 列 D Agostino 检 验 (DD 检验 ) 更 好 些 . 
《2) 万 检验 (xz50) 
对 于 检验 问题 : 

互 , :X 服从 正 态 分 布 尖 瓦 。:X 不 服从 正 态 分 布 


了 mmD 
”LOLC 


取 统 计量 





四 ae 7 Xe 


wo/ 袜 C 一 


rrD 门 noDQon Anna 
愉 AAAN\LZ KJ)LC AN 十 


0. 0<9 985 98 
有 确定 的 极限 分 布 ,记分 布 密度 为 g(x)， 取 否定 域 
YY 一 其 中 履 , 1 满足 


\1] >AAZ 1P 僵 





7OQON 
fi/ 


MC 
| 


| 1 
| scodx= 呈 | sodw 1 一 3 


国标 附 有 cx 一 0. 01,0.05,0. 10 时 Mi,)z 的 值 . 
S$8 . 几 种 常用 的 非 参 数 愉 验 


在 假设 检验 中 ,除了 已 知 总 体 分 布 类 型 ,对 若干 个 未 知 参数 作 
统计 检验 的 参数 统计 检验 外 ,还 有 一 类 所 谓 非 参数 检验 . 非 参 数 
检验 往往 不 假定 总 体 的 分 布 类 型 ,直接 对 总 体 的 分 布 的 某 种 假设 
(例如 对 称 性 、 分 位 数 大 小 等 等 假设 ) 作 统计 检验 .当然 ,上 一 节 介 
绍 的 拟 合 优 度 检验 也 是 非 参 数 检验 ,除了 拟 合 优 度 检 验 外 ,还 有 


?和 汞 和 名 辣 用 鬼 省 会 兴 从 闪 站 NA 寺 E 会 尖 j Te 和 上 县 在 3 漆 ,. 计 
yj ”人 1] 站 JR FE 人 。 人 ~ | 


数 统计 量 、 秩 统计 量 、 符 号 秩 统计 量 . 分 别论 述 如 下 . 


(Cs ) 计数 统计 量 
定义 8.1 设 X 是 随机 变量 ,对 给 定 的 实数 0 , 记 
几 一 内 和 一 0o) 
其 中 
1， 当 帮 0 
几 Ci) 一 0， 当 ; 均 0 (8. 1] ) 
则 称 ! 为 X 按 0 分 段 的 计数 统计 量 . 


moT Q 1 SET Ar bp 二 人 AN 大。 <- 芭 类 fr 
和 下 址 6, 工 没 Xi …，X， 相互 独立 ,和 X 有 连续 分 布 图 数 


了 你 ) 坟 又 了 ;0 ) 一 力 。 ,0<, < 1 二 1, 7 即 了 (CCZ) , 荆 ， 〈 工 ) 


有 共同 的 加 分 位 数 癌 ). 页 ，…, 丈 分 别 是 X; ,…,X, 的 按 b 分 自 
的 计数 统计 量 . 则 ，… 几 相互 独立 同 分 布 , 共 同 分 布 是 参数 为 
1 一 加 的 们 努 利 分 布 . 

证 明 :显然 . 

从 定理 8. 1 知 , 任 一 依赖 册 ,…，, 几 的 统计 量 工 (办 ，… 几 ) 对 
一 切 如 分 位 数 为 pm 的 连续 分 布 有 固定 不 变 的 分 布 . 因而 可 用 这 
样 的 统计 量 去 检验 总 体 分 布 的 分 位 数 的 假 人 . 


4KTQ 1 
IJ 5. 旺 侍 导 检验 


议 XI ，… ,入 ， 是 来 自 连续 分 布 总 体 的 简单 随机 样本 . 对 于 检 


HE 


验 问 题 : 
厅 ， : F(0) 一 本 蔬 : F(0) 所 了 


X, 中 取 正 号 的 个 数 , 在 H。 下 B 的 分 布 是 参数 为 和 亏 的 二 项 


C: (Ci 尽 可 能 
N2 了 局 


1 /全 


rn 了 
如 E 克 时 拒绝 五 


同样 地 , 若 要 检验 . 瑟 , ;Fb ) 王 各, 只 需 取 统计 量 了 B 一 之 / 惰 X 二 


0) ,在 责 。 下 它 有 分 布 (1 一 加 ), 由 此 就 可 确定 检验 的 否定 域 . 
符号 检验 是 实际 工作 中 一 种 常用 的 检验 . 例如 ,在 进行 某 项 
对 比 实验 时 ,X 是 未 施加 某 一 处 理由 的 记录 ( 某 一 特性 值 的 测量 


-C_ 
2 
定 域 , 当 且 仅 


由 


4 “处 理 ”(treatment) 一 词 含义 很 广 ? 可 以 指 某 项 设计 9 可 以 指 某 项 工艺 ? 可 上 人 指 
某 项 手段 ,也 可 以 指使 用 某 种 药品 等 等 .“ 处 理 ? 可 理解 为 “措施 ”. 


mA 
本 


值 ),Y 是 施加 某 一 处 理 的 记录 . 要 判断 有 无 处 理 效应 ( 即 判断 施 
加 处 理 与 不 施加 处 理 在 结果 上 有 无 差别 ), 和 常 研 究 随机 变量 了 一 
汪 . 右 无 处 理 获 应 , 则 工 与 X 有 相同 分 布 ,一 必 的 分 布 二 ( 纺 是 头 


于 0 对 称 的 ,因而 F(0) 一. 以 轴 一 局 Y, 一 X, 为 样本 , 考 


恋 . 了 各 工 世 下 的 产品 是 原 工艺 下 人 品质 量 确 有 改 

进 ,随机 地 取 一 新 产品 和 一 旧 产 品 作 为 一 对 进行 比较 , 共 比 较 了 20 

对 . 记录 如 下 ( 十 “表示 新 产品 好 ， 一 ”未 示 旧 产 品 好 ) 
人 
和 

检验 问题 是 


HE :新 旧 产 品质 量 一 样 -> 妃 , :新 产品 比 旧 产品 好 


由 让 图 入 日 和 了 玲 作 的 田 束 译 示 癌 》 测 结果 中 “十 ”号 
和 八 J 几 L JJ /1 73 人 ji 工 / LN AL -人 个- 人 | 可 


的 个 数 . 给 定 显著 性 水 平 u; 找 尽 可 能 小 的 整数 C 满足 : P(B>>C 
HU)<c. 取 克 ={C,C 十 1,…，,20} 帮 为 否定 域 , 当 且 仅 当 BE 丈 
时 拒绝 ,. 若 x=0. 05 , 查 本 书 附 表 8 知 C 王 15. 由 本 例 的 实际 结 
果 算出 B 一 16>15, 故 否定 瑟 ,, 即 认为 新 产品 比 旧 产 品 在 质量 上 
确 有 改进 . 

(二 ) 秩 统 计量 

定义 8.2 设 Z,,…,2Zw 是 来 自 连续 分 布下 (z) 的 样本 ,其 次 
序 统计 量 记 为 Zu 入 …< 和 Zu , 令 

Ri 一 min 人 Re:1 迄 有 & 过 入 ,Zi = (一 1;，2， ,和 八 ) 
称 尺 , 为 Qi 的 秩 . 

定理 8.2 设 2 ,…，,2Zv 是 来 自 连 续 分 布 下 (>) 


人 AN 分 别 是 刀 2 的 秩 , 则 随机 回 量 玫 一 (dk， 》”” R_) 在 集合 | 


A 一 (7 : ”是 1，……, 人 和 的 一 个 排列 } 
上 均匀 分 布 , 即 对 1,…… 六 的 任 一 排列 y 有 
PCR = 力 一 凡 (8. 2) 


一 PCCZ, ，… Z 2 

二 上 (Lu 2 ) 一 (0 9 ZN ) ) 

2 
其 中 二 是 数 ; 在 排列 y 中 的 位 置 , 即 ;一 入 .又 因 (2, ,…，,Zw) 与 
(Z。 ，…,Z ) 同 分 布 , 所 以 

PCR =7 力 =P(Z 一 DZ 一 …<QN) 
这 对 一 切 yEA 均 成 立 , 故 (8. 2) 成 立 . 证 毕 . 
由 和 定理 8. 2 知 , 仅 依赖 尺 的 统计 量 工 (RD) 对 任 一 连续 分 布 总 

体 有 固定 不 变 的 分 布 . 这 一 类 统计 量 称 秩 统计 量 , 在 非 参 数 检验 
中 有 广泛 的 应 用 . 最 常用 的 秩 统计 量 是 下 列 例 8. 3 中 的 Wilcoxon 


了 和 天 LA > 组- 
秩 和 统 /| 量 . 


例 8.3 在 对 照 实验 @ 中 有 两 个 总 体 :FCz) 和 CCGz).， Xi … 


ee 


了 ns 一 人。 抱 了 “了 上 和、 上 过 


X,, 是 对 照 组 的 观测 值 ， 它们 是 来 自 FCz) 的 样本 .六 ，…Y， 是 
理 组 的 观测 值 , 它 们 是 来 自 CGGCz) 的 样本 . 检验 问题 是 
厅 ,:TGCZzi 三 CCZ)<e> 万 ) Cr 并 站 
[( 鞭 由 0 县 外 理 训 应 、 
RS 一 vv 二 多 LA 7。 
将 其 和 …，X。， Yi ，， 2 二 全 这 入 十 2 一 入 个 随机 变量 混在 一 一 起 
问 FE RE II IT 一 症 ET 2 AL 二 PR 式 扩 
JJ 六 "AL 二 JU_ 作 J PPZXJ79 1) 生 对 应 的 秩 : 


QQ ,Ri ，…,R， 


(人 ff 昭和 年 玲 让 二 让 评 难 筷 芝 计 了 十 
\/ 间 由 关 牛人 尾 二 作业 也 下 六 儿子 记 直 上 人 F 


体 分 为 两 组 ,第 一 组 的 个 体 不 施加 某 处 理 , 第 二 组 的 个 体 缘 施加 某 处 理 . 试验 目的 是 比 
较 施 加 某 处 理 与 不 施加 某 处 理 在 效果 上 有 无 不 同 . 此 时 第 一 组 叫做 对 照 组 ,第 二 组 叫 
做 处 理 组 . 


as 


了 
JUU 


人 上 由 吉田 它 的 全 立 昌 . 按 本 抽 环 的 个 
了 丁 肌 而 ， 已 有 局 入 上 下 :人 世人 有 1 


Wilcoxon 秩 和 统计 量 为 


直观 上 可 以 看 出 , 若 瓦 为 真 , 则 三 应 该 比较 大 . 由 定理 
5 1 互 。 下 Qi es LA1 9 ， 的 联合 人 
村 


中 《OU YL SR -HKXT LA FEEH AAA 
上 L | 人 王 之 风 3 57,7) 时 拒绝 万。. 本 书 附 表 列 遇 J 中/ 让 J UN3IP 有 
例 8.4 用 两 种 材料 A 及 B 制造 同一 种 产品 . 今 分 别 随机 抽 
Te 一 全 一 一 YL AAA 一 ie -ae 了 ww 一 ay 和 【Tt 7 了 Ti AR 3 YI 一 
虚 石 二 大 达 1 志 坟 ， 坟 厂 HR 二 有 雪 如 雪 有 及/ 从 LI3HF2UAB 
及 ， 及 


(这 里 了 表示 材料 了 制 成 的 产 


品 
PPD ， 
两 种 材料 对 产品 性 能 有 无 不 ee 


六 JTJIA HH 有 局 忆 “ 志 


此 问题 可 换 成 双边 检验 问题 : 
HB,:4 与 B 两 种 材料 效果 一 样 过 媚 , ;4 与 孔 效 果 不 同 
用 Wilcoxon 秩 和 统计 量 作 检验 . 太 等 于 已 材料 产品 在 排序 


中 的 秩 之 和 . 给 定 显著 性 水 平 ,确定 临界 值 友 ， 人 寻 ] 和 


Ar 


二 1a | 
上 LW < 让 117537 1 有三 本 


HUVUrVr (2 RU~U /QQ ， HHE -不 

-1 仆 一 | 天 天 人 “2 | ee ee Ji 一 [Lo 旺旺 人 

tr 一 __ 症 2 TI -AN 1AnN -水 大 由 证 人 Et = AE TI -DO TI 

人 鲍 中 到 二 1 7 二 50. 由 c 一 0.10, 但 WW 的 临 刘 但 表 街 内 1 二 42yWW :二 

43. 由 样本 算得 克 =1 十 2 十 4 十 5 十 8 王 20<<22, 故 样本 落 人 否定 

域 . 我 们 应 否定 五 ,认为 4A,B 两 种 材料 对 产品 质量 有 -显著 差异 
(三 ) 符号 秩 统计 量 


XXX 中 | 的 秩 称 为 X; 的 绝对 秩 , 记 为 Rzr. 而 wRr 
称 为 X, 的 符号 秩 , 其 中 少 一 办 X;) 是 X; 按 0 分 段 的 计数 统计 量 . 

定理 8.3 设 X 是 随机 变量 ， 汪 分 布 函数 连续 且 福 这 分 布 六 
于 0 对 称 ， 则 7 一 YX 与 |X| 独 立 ， 

证 明 : 若 :<0, 则 P(G=0,|X| 委 局 =0= P(J= 0)P(CIXI 反 
让 , 忆 CV 一 1 ,|X| 委 已 =0 王 PC 一 1)PCIXI 委 D; 若 之 0, 则 

PC 一 1 | 和 | 委 蚊 =PGX> 0, | 和 XI 的 

一 P(0 一 和 雪 甩 
到 PCIXI 


一 P(V 王 1)PCIXI 委 所 
类 似 地 有 
PC 一 0,，|X| 系 和 看 = PG= OPGXIS 


由 独立 性 定义 知 V 与 |X| 独 立 . 证 毕 . 
定理 8.4 . 设 Xi ,…,X, 是 关于 0 对 称 的 连续 分 布 的 样本 , 则 
对 应 的 计数 统计 量 J(X )，…,wCX,) 与 它们 的 绝对 秩 R+ = 


二 ri AN \ AAAL1 7 9》 》、 人 < 1 JJ 天 一 L 


( 甩 十 PT+ NA 王 hh mr /YANVHIE AL AAA 
2 ?LI 7 ID 4RnACC， Yi AH 人 KAN 天 9 HR IN JJAOIR “上 

了 s% 7 十- 一 A_ | Ye .了 人 人 大 大 一 PN 一 一 
1,…，72),R 在 4=(t7y:7 为 1,2, 7 的 排列 /上 区 色 分 布 . 


证 明 : 由 定理 8. 3、 定理 8. 1 定理 8. 2 立刻 可 得 本 定理 的 
由 定理 8.4 知 , 只 依赖 % 一 (Y%CX )，…，%(X。)) 与 及 一 
(Rr，…,Rz ) 的 统计 量 T(V,R+ ) 对 关于 0 对 称 的 连续 分 布 总 体 
有 固定 不 变 的 分 布 ,因而 可 用 这 类 统计 量 构造 关于 总 体 分 布 对 称 
性 的 检验 . 

例 8.$ Wilcoxon 符号 秩 统 计量 


SEA < \AO LE -TEN 上 
Bi LA1L9 9LAn 是 来 目 下 ( 工 ) 中? \ LI] 二 2 大 上 L 上 月 人 JJ NAN UV 


( 即 FF 一 z) 三 1 一 F(CO 二 xz)).， 考虑 检验 问题 ， 
068 。 


| 


瑟 , :0 一 0 万 :0 加 
令 忆 = 和 一 bi=lsza)y2Z 2Z。 的 符号 鞭 筷 为 
/2QD)R 0C2Z.D)Rr Wilcoxona 符号 秩 统计 量 为 


在 丽 下 殉 + 应 有 较 大 的 值 . 在 Hos 下 鸡 + 有 确定 的 分 布 , 故 给 定 
显著 性 水 平 ,有 确定 的 临界 值 w+ (im) 满 足 


PP( 太 之 克 - (ai572) | 万 入 wa 


当 上 且 仅 当 砚 + 之 友 + feim 时 拒绝 H，W+ (aim) 的 值 可 从 特制 的 
表 中 查 出 . 
在 结束 本 章 之 前 ,我 们 给 出 下 面 一 个 很 有 启发 性 的 例子 ,表明 
检验 问题 的 提 法 和 处 理 方法 是 灵活 多 样 的 ， 
气象 学 家 记录 了 1942 一 1981 年 间 共 40 年 Raleigh( 位 于 美国 
北 卡 罗 来 纳 州 ) 的 年 平均 气温 . 数据 如 表 8. 1( 单 位 :华氏 温度 )， 















































1943 2 60 195 了 61.3 1963 57.5 1973 59. 8 
1944 “59.8 | 19%54 ”60.1 | 19%64 58.9 | 1974 5 
1945 60. 3 1955 59. 6 1965 59. 1 1975 59. 6 
IT946 60. 4 1956 59. 9 1966 ”58.7 1976 58. 7 
1947 ”59.1 1957 60.1 1967 59.1 1977 58. 6 
1948 59.8 1958 57.4 1968 58.4 1978 59. 1 
1949 ”61.4 | 1959 59. 9 1969 ”56.9 1979 58. 6 




















1951 600. 1 1901 258.7 |‖ 19741 ,9. 0 1981 28. 3 


以 时 间 ( 年 份 ) 为 工 轴 , 温 度 值 为 y 轴 . 可 在 平面 上 画 出 40 个 
点 (所 谓 散 点 图 ). 由 此 可 以 近似 看 出 ,平均 气温 有 下 降 的 趋势. 
现在 问 :如 何 判 断 Raleigh 是 否 真 的 在 变 冷 ? 

对 此 问题 ,不 同 的 统计 学 家 可 能 利用 不 同 的 方法 进行 检验 ,这 


上 县. 央 为 大 宏 有 能 人 惧 由 了 不 后 的 个 定 如 果 我 们 采取 尽 可 能 弱 的 假 
征 问 人 人 和 八 练 有 此 也 由 全 有 和 取 生 如 不 失 用 不 友人 全 RH 有 JJ 


定 , 例 如 不 假定 温度 服从 任何 特定 的 分 布 类 型 , 则 可 以 将 40 个 数 


攻 和 人 个 RS 大 HE AH 诗 语 个 RE TDTrA 二 人 F 人 个 公文 十 733? 
Jp 月 人 上 [ 电 4URJJITFZ JJ， 人 三 | 渤 银 ,可 YA 人 | 机 。 


更 具体 说 , 设 第 ;年 的 温度 是 vi = 1942,1943,…,1981)， 称 


*。， 一 人 个旧 上 hh、 必 百人 了 HEEI 上 内 慷 
(y; yi)(C<< 1) 是 协调 有 刚 看 < y) ; 称 (y， ,yi)CI< TI) 征 个 协调 的 ， 


若 这 记 ， 设 “ 协 调 对 ”的 总 数 是 Mi “不 协调 对 ”的 总 数 是 M:. 
M 王 Mi 一 M: .从 直观 上 看 , 若 'M, 比 M: 偏 大 则 说 明 有 变 暖 的 趋 
势 , 若 Mi 比 M: 偏 小 则 说 明 有 变 冷 的 趋势 . 若 Mi 与 M: 相差 不 
类, 即 1MI 靠 近 0 时 , 则 表明 无 变 姐 或 变 冷 的 趋势 . 设 刀 ,是 假设 : 
无 趋势 . 则 据 上 面 的 分 析 , 当 | MI| 较 大 时 应 拒绝 囊 ". 这 个 检验 法 
是 合理 的 ,但 |MI| 多 大 才 应 拒绝 五。 呢 ? 即 如 何 确定 临界 值 ? 注 
意 ”个 不 同年 份 的 温度 共有 7! 种 排列 方式 ,在 也, 二 ,它们 应 是 


4 Tf 合 P 山 片 FEI 7 RN zt HTe 7 六 C P ) - 讨 rc 刀 由 所 有 
-可 -JRCDHNJ。 EL ， 朋 A 过 (1 人 让 六 1 下 工 | RHJNVZL97 9 7 9 Sa /1 


的 排列 组 成 ( 共 l .个 元 素 ),9 由 0 的 所 有 子 集 组 成 ,而 忆 给 予 
的 每 个 元 素 以 六 的 概率 . 有 了 概率 空间 ,就 可 得 到 H。 下 M 的 概 
率 分 布 . 在 本 例 中 ”一 40, 计 算 较 繁琐. 根据 上 面 的 40 个 数据 , 计 


ne 人 L 人 


算出 M 的 数值 是 一 329. 但 经 过 理论 研究 ,在 五 " 下 随机 变量 M 
不 超过 一 329 的 概率 小 于 0. 001. 因此 在 检验 水 平 0.001 下 应 抱 
绝 互 。. 换 句 话说 ,在 Raleigh 年 平均 气温 有 下 降 的 趋势 . 〈 此 例 摘 
自 The fassination of statistics, 下 dited by R. J. Brook et al. ， 
p,. 161 一 172, Marcel Dekker inc. 1986). 所 用 的 检验 就 是 所 谓 的 


Mann trend test， 





设 入 1 芝 ， , 人 3 是 来 自 Bernoulli 0 ， 力 ) 分 布 的 样本 ， 检验 问题 


| 
也 门 
(1VU 。 


叶 


] 攻 
二 : 力 一 了 合用 人 


的 一 个 否定 域 为 
允 王 (人 ((Czlyzzy Za3) :zl 十 并 下 3 2 


二 3 
试 求 该 否定 域 的 第 一 、 二 类 错误 概率 和 轧 一 也 下 
2. 设 Xi ,X: ，，,X, 是 来 自 密度 函数 为 F(z) 的 总 体 的 样本 ,关于 (z) 
有 假设 检验 问题 ， 





Ho :jz) 王 万 (z)e 甩 :7Cz) 一 广 (z) 
其 中 万 (z) 和 广 (z) 都 是 已 知 函 数 , 令 砚 为 假设 吾 。 的 否定 域 , 试 通过 户 (z) 
和 户 (z) 表 示 两 类 错误 概率 . (万 (z) 不 恒 等 于 户 (z))， 
3. 设 X 是 (6 一 椰 ,b 十 地 ) 上 的 均匀 分 布 的 一 个 观测 值 , 考 虑 假设 检验 
问题 8 
:0 雪 3 万.:0 之 4 
构造 检验 法 ,使 其 功效 函数 p(6) 满 足 
o(g) 一 0, 当 9 和 受 3;o(0) 一 1, 当 9 达 14 
( 即 两 类 错误 概率 均 为 零 ) 
4. 设 随 机 变量 X 的 分 布 密度 FGCz) 可 取 下 面 的 AhA(Cz) 或 同 Cz)， 


站 ar Pr ae 一 


人 二 有 志和 
其 他 

2 0 
| 末 = 苹 

( 0， 其 他 


基于 一 个 观测 X ,来 回答 检验 问题 : 
瑟 , : fGz) 一 疙 CCz) 二 万 FZz) 王 万 (Z) 
取 检 验 水 平 0.1, 求 出 使 第 二 类 错误 概率 8 最 小 的 检验 法 . 


KE 3 让 省 丰 如 不在 称许 (,O 
D。 区 了 随 1 艾 星人 和 和 礁 人 和 有 (2Z50O0) 0 未 知 ,zlyzz，， 》 必 


本 ,考虑 假设 检验 问题 : 


迷 
> 
人 导 
芭 


玉 。 :0 一 0 一 玉 .:0 一 b 
其 中 加 六 bi 是 给 定 值 . 设 ca,2 为 给 定 的 正 ' 常 数 ， 记 


LCz,0) 一 | FAGz6) (zz 一 (zzn)) 
1 一 ] 
考虑 如 下 检验 法 入 : 当 aLGz,b)>pLCzb) 时 接受 瑟 , 当 aLGzypb) 到 


e 7 
/ 


了 
工 


| 


pLz,b) 时 拒绝 媚 。 ,如果 aLCz,b) 王 纪 (z0) 则 既 可 接受 囊 。 也 可 拒绝 
叫 。. 议 c 太 为 人 的 第 一 .二 类 错误 概率 , 试 证 对 
的 第 一 二 类 错误 概率 , 必 有 
aa ”十 28- 

6. 设 和 一 No ) po 已 知 , XXX，…X。 是 X 的 样本 .: 试 分 别 求 出 
下 列 检 验 问题 

(1) 互 。 :0 ol(oo 已 知 ) 

(2) 万 。 :天 委 cl 或 c >cc 瑞 ai<a <<cas 

(ci 2 已 知 ,GO1 <<02 ) 


的 UMDP 检验 (检验 水 平 为 ,以 下 各 题 非特 别 指 出 者 缘 同 此 ). 


7 消 WN， TY sy 目的 栏 木 汪 提出 失 栓 问 题 
1。 2OL -< 人 YN\EC9L/ ?LAL9 LA2 9 ”9 Zr / 开 个 RTM AN 
囊 。 :US 或 pm 二 玖 .1 < 扩 pp<1 
(yy 电 知 ,< 一 ，，) 
\ 天 1 了 2 7] > Fl 克 2 
的 UMP 检验 . 
8. 设 Xi ,X:，…，X。 为 参数 1 未 知 的 Peisson 分 布 的 样本 , 试 选 适 当 的 
检验 水 平 < 求 检 验 问 题 


万 。 :人 一 人 0o<> 有 万。 :人 过 An (An 已 知 ) 


万 , : 户 王 加 oe* 万 :bp 雯 加 (po 已 知 ) 
的 一 臻 最 大 功效 无 偶 检 验 CUMEPEU 检验 ). 


10. 设 太 ] , 及， 2 ， 入 ， 是 [0 ,0 上 的 均匀 分 布 的 样本 , 求 假设 检验 问题 
:0 一 be 万 :0 二 0 
的 UMP 检验 . 


11.， 设 是 | ,XXX 是 NI 
了 了 e 辽 < 了 1 ?< 女 了 2Z 9 是 


”LA7r. ZE / 9 上 1 ) 的 样 


本 ,对 检验 问题 
AT 


Ho :wx 雪 0o 玉 之 0 ; 
(1) 求 出 <=0.025 的 UMP 检验 ， 并 求 出 其 功效 函数 CA 
(2) 为 了 使 kw 之 0. 5 时 上 述 检验 的 功效 po(Cw) 之 0. 9, 样 本 量 半 至 少 应 取 
多 大 ? 


anN 八 1 (Y -< 一 由 An1 二 -水 

\D/ /局 以 [~ vv LNHjJ OAT 人 个 《 / 

]2 设 X 一 No )， XXX， 从 ， 是 入 的 样本 ,cn 是 已 知 正 数 
。 172 。 


《1) 对 检验 问题 


找 出 UMP 检验 法 ; 
(2) 对 检验 问题 


找 出 UM 
(3) 证 


玫 


丛 验 
对 


加 


于 检验 问题 
万 , :ca 一 aoe 万 : :ax 所 Go 
不 存在 一 致 最 大 功效 检验 . 


AZ 人 万 人 十 2 AH = 时 Y7 


1 二 到 到 2 An Am 二 -上 -HTw ， 
13. 由 经 验 知 某 零件 重量 一 No ) ,wp 一 15,o 三 0.05, 技 术 革 新 后 ， 
抽 : 了 6 个 样品 ., 测 得 重量 (单位 :g?) 为 


14.7,15.1,14.8,15.0,15.2,14. 6 


虽 时 有 上 和 哩 由 SA 昌 旺 所 7 各 人 


ee 问 平 均 重 量 是 否 仍 为 15? 《ce 一 0.05) 
设 户 (z) 是 个 自由 度 的 上 分布 的 密度 , 即 











(一 ) 
广 (zr) 严 十 全 ) 
(全 ) Vi 
试 证 明 
lim 六 (z) 一 一 一 e 训 (对 一 切 zE (一 ,十 co)) 
元 一 > CC A\/ LT 开 
15， 设 Xi ,XXX 为 正 态 分 布 NG 1) 的 样本 ,对 假设 检验 问题 
1: 孝 10 一 天 扫 10 Ci 


求 出 水 平 = 0.1 的 UMP 检验 ,并 求 w=9 时 此 检验 法 的 功效 , 求 出 zw= 11 时 
接受 万 的 概率 . 


一 


， 从 某 正 态 总 体 中 抽取 了 9 个 数据 ,和 





在 水 平 0.05 和 0.01 下 分 别 检验 
(1 To :0c 万 。:w>0 
(2) 下, :wx0e 甩 :ww<<0 
艇 释 结 果 的 意义 ， 如 果 样 本 量 增加 到 了 .25, 而 统计 量 斑 与 S 仍 分 别 为 0.4 


和 1.0, 再 进行 上 面 的 检验 并 说 明 结 果 的 意义 . 
7. 某 糖 厂 用 自动 打包 机 打包 ,每 包 重 量 的 额定 值 为 100 kg, 每 天 开工 


7 


es。 了 了 73 。 


需要 检验 一 下 打包 机 工作 是 否 正常 , 即 检查 打包 机 是 否 有 系统 侦 差 . 某 卓 


二 | 


测 得 9 包 的 重量 (单位 :kg) 为 
9 98.7 ,100.5, 101.2,98.3,99.7 ,99.5,102. ,100. 5 


9. 3， 
;该 日 打包 机 二 人 作 有 上 且 二 正 党? (一 0 OK :中 知名 重 昭 只 下 太 个 在 
2 


18. 正常 人 的 脉搏 平均 为 72 次 /分 , 某 医生 测 得 10 例 慢性 四 乙 基 铅 中 
毒 患 者 的 脉搏 (次 /分 ) 如 下 : 

54,67,68,78,70,66,67,70,65,69 
已 知 这 些 患 者 的 脉搏 服从 正 态 分 布 , 问 :四 乙 基 铅 中 毒 患 者 的 脉搏 与 正常 人 


H 捧 右 天 局 划 关 2? -~ 人 八 和 FA 
的 航 搏 有 AU 有 大 开 (Ca 一 0. UUD / 


| 和 用 热 敏 电阻 测 温 仪 间接 测量 地 热 勘探 并 底 的 温度 ， 重复 测量 7 次 ， 
测 得 温度 (CC ) 为 

112.0,113.4,111.2,112.0,114.5,112.9,113. 6- 
而 用 某 种 精确 方法 测 得 的 温度 为 112. 6( 可 看 作 温 度 真 值 ) ,试问 :用 热 敏 电 
阻 测 温 仪 间接 测 温 有 无 系统 偏差 ? (ac 一 0. 05) 

20. 某 工 厂 采 用 新 法 处 理 废 水 ,对 处 理 后 的 水 测量 所 含 某 种 有 毒物 质 的 
浓度 ,得 到 10 个 数据 (单位 :mg/Ly): 

22,14,17,13,21,16,15,16,19 ,18 
而 以 往 用 老 法 处 理 废 水 后 ,该 种 有 毒物 质 的 平均 浓度 为 19. 问 : 从 对 这 种 有 


中 站 重生 | 昌 ” 帮 ”到 


书 范 


上 


可 


人 


毒物 质 的 处 理 来 看 ,新 法 是 否 比 老 法 效果 要 好 ? (ca 王 0. 05) 

21， 有 某 种 导线 ,要求 其 电阻 的 标准 关 不 得 超过 0.005(Q). 今 在 生产 的 
一 批 导 线 中 取样 品 9 根 , 测 得 S=0.007(Q) , 设 总 体 为 正 态 分 布 , 问 在 0. 05 
水 平 下 能 认为 这 批 导 线 的 标准 差 显 著 地 偏 大 吗 ? 

22. 某 机 床 厂 某 日 从 两 台 机 器 所 加 工 的 同一 种 零件 中 ,分 别 抽 看 干 个 样 
测量 零件 太 寸 ,得 

第 一 台 机 器 的 6.2,5.7,6.5,6.0,6.3,5.8,5.7,6.0,6.0,5.8,6.0 

第 二 台 机 器 的 5.6,5. 9,5.5,5.7,5..8. 6.0,5.5,5.7,5.5 
问 : 这 两 台 机 器 的 加 工 精 度 是 否 有 显著 性 差异 ? (wx 一 0. 05) 

23. 检查 了 26 匹 马 , 测 得 每 100 mL 的 血清 中 ,所 含 无 机 磷 平 均 为 
3. 29 mg ,标准 差 为 0.27 mg; 又 检查 了 18 头羊 ,100 mL 的 血清 中 含 无 机 磷 平 
均 为 3.96 mg, 标 准 差 为 0. 40 mg. 试 以 0.05 的 检验 水 平 , 检 验 马 与 羊 的 血清 
中 含 无 机 磷 的 量 是 否 有 显著 性 差异 ? 

.24. 10 个 失眠 患者 ,服用 甲 ， 乙 两 种 安眠 药 ， 延长 睡眠 时 间 (h) 如 下 夫 
1 


= 了 到 
ee 了 了/ 蔚 量 


患者 编号 1 2 3 4 5 6 
甲 安 眠 药 1.9 0. 8 1.1 0. 1 一 0.1 4. 4 
乙 安眠 药 0.7 ”一 1.6 一 0.2 一 1.2 一 0.1 3. 4 
患者 编号 7 8 9 10 
甲 安眠 药 5 1. 6 4. 6 3. 4 
乙 安眠 药 3. 7 0. 8 0 2.0 

问 :这 两 种 安眠 药 的 疗效 有 无 显著 性 差异 ? (可 以 认为 服用 两 种 安眠 药 后 增 


加 的 睡眠 时 间 之 差 近似 服从 正 态 分 布 ,ae 一 0. 05) 
25. 比较 甲 、 乙 两 种 安眠 药 的 疗效 . 将 20 个 患者 分 成 两 组 ,每 组 10 人 : 
甲 组 病人 服用 甲 种 安眠 药 , 乙 组 病人 服用 乙 种 安眠 药 ,如 服药 后 延长 的 睡眠 
时 间 分 别 近 似 服 从 正 态 分 布 , 其 数据 仍 如 上 题 ( 这 时 数据 不 再 有 成 对 的 关 
和 (一 0. 05 ) 
26. 设 X~NCay os),7 一 NO 0) XI ，X。 


9 
三 | 的 样本 2 
二 2， ,mn 古 i 的 御 本 ,运用 矿 久 人 飞 然 比 方 流 村 出 


T 了 二 f 上 允 I 
二 上 站 2 FL1 一 上 zt* 忆 。: : FL1 忆 ]2 \【L 人 H 


ZA 本 设 及 1 , 入 9 入， 是 来 目 指 数 分 布 
太 CZyO 一 订 e 六 


(zz 之 0) 的 样本 ,了 1 ,2 9 ”“” 亲 是 来 目 指数 分 布 


二 二 ] 工 
帮工 ,人 2 ) 一 一 ee 07 
lz 


(z0) 的 样本 , 且 两 个 样本 相互 独立 . 这 里 , ,9 是 未 知 的 正 参数 . 
(1) 对 检验 问题 


.0 一 0 < 天 
下 


< 。 有 门 
LOU 一 (2 玫 :UV 


位 自 


SEO， 
1 2 


找 出 广义 似 然 比 检验 法 . 


玫 
呈 


之 1 从 
人 
Y， 


1 一 ] 


~ 
(nn 
4 


(3) 你 能 求 出 统计 量 过 -一 在 互 。 下 的 分 布 吗 ? 
党 


1 一 ] 


28. 在 一 正 20 面体 的 20 个 面 上 ,分 别 标 以 数字 0,1,2,…，9, 每 个 数字 


在 两 个 而 上 标 册 慷 检 了 验 庆 且 所 二 全 和 称 扩 司 ROO 交 机 掉 计 了 难 
侍 辣 天虹 王 怀 看. 施 伺 格 蕊 征 主 硕 开 汉人 尿 ， 关 人 了 」】o5U 从 坟 了 区 记过 


2,…,9 朝 下 上方 的 次 数 如 下 : 
数字 0 1 2 3 4 5 6 7 8 
频数 74 9%2 83 79 80 73 77 75 76 91 
问 :该 20 面体 是 否 色 称 ? 
29. 试用 柯 氏 检验 法 检验 下 列 25 个 数据 是 否 来自 N(0,1) 分 布 (ca 一 
0. 05 ) ; 
一 2.46 .一 2.11 一 1.23 一 0.99 一 0.42 .一 0.39 一 2.21 
一 0.15 一 0.10 一 0.07 一 0,.02 0.27 0,.40 0.42 0.44 
0.70 0.81 0.88 1.07 1.39 1.40 1.47 1.62 1.64 1.76 
30. 在 对 UFO 的 调查 中 , 查 问 了 1 276 个 自称 看 到 飞碟 的 人 ,并 按 他 们 
看 到 飞碟 的 地 点 及 飞 矶 的 形态 进行 分 类 ,结果 如 下 : 


( 


ET 7 


看 到 的 飞 -长 关上 折 上 导 开 mm 人 站 
碘 的 形 太 翔 的 碟 形 38 412 


| | 
其 他 形式 | 9 59 


洲 - 
检验 “看 到 飞碟 的 地 点 ”与 “看 到 的 飞碟 的 形态 是否 独 立 (c 一 0. 05) ,并 说 明 


上 上 证 一 


检验 的 结果 是 支持 还 是 反对 飞碟 的 存在 性 . 
31. 甲乙 二 人 分 析 同 一 气体 的 CD 含量 , 当 二 人 的 分 析 数 据 没有 个 人 


间 的 差异 时 ,应 有 相同 分 布 , 从 而 “ 甲 的 数据 一 乙 的 数据 ”的 分 布下 (z) 关 于 
my HT 田 评 下 HA TFTT 有 AN 一 ] -证 Rzt 7 ff -一 中 
AT 下 。 JI/ LO  ” ，  nD。 有 和 伯 上 中 人 LiL09 信 男 | 





甲 14.7 14.8 14.7 :15.0 14:9 14.9 15.2 14.7 15-4 
乙 14.6 14.6 14.8 15.3 14.7 14.6 14.8 14.9 15.2 
32. 用 两 种 材料 的 灯丝 制造 灯泡 , 设 甲 材料 灯泡 的 寿命 分 布 为 下 (z), 乙 


材料 灯泡 的 寿命 分 布 为 下 (z 一 5). 今 分 别 就 两 种 材料 灯泡 随机 抽取 符 干 个 
进行 寿命 试验 ,得 到 寿命 (单位 :h) 数 据 如 下 : 


| 1A 了 ANW 1ARKENW 1ARARn 17 17FnW 170Dn 1 Rnn 
“19 不 了 LU LUuUUVvy LDOUV LTJLU LuUU9 LU OUVU 
乙 材 料 .， 1580，1 600，1 640，1630，1 700 


水 平 w 王 0. 05) 
33. 设 两 样本 Xi ，， XiYi yy, 一 起 排序 得 到 的 秩 统计 量 为 (Q,， 


Q: ,… ,QiR ,R: ,…,R.) ,Wilcoxon 秩 和 统计 量 太 = SR , 试 证 明 


f 一 人 


了 =- 2wy - Xi) 十 二 zz 十 了 


1 一 ] J) 一 


其 中 


/ 之 (0 


ae 


了 
(t) 一 
Y 人 上 < 刀 0 


we 


~ 
、N 


第 四 章 ”回归 分 析 与 线性 模型 


8$S1 引 言 

回归 分 析 是 数理 统计 学 的 一 个 重要 组 成 部 分 , 它 的 任务 是 人 研 
MY TPR -二 -WO 二 HT 7z 志 一 7 放 < 直 .~ 间 的 经 验 公 式 站 AEYvLITY 
A 省 之 时 一 | 可 有 JJ 世 大 人 尔 ”过 L 之 里- 一 加 有 < 和- 刀 入 工区 过 于 JJ 和 从] 
和 控制 的 目的 . 

线性 模型 是 数理 统计 学 中 一 种 应 用 十 分 广泛 的 模型 ,线性 回 
归 分 析 、 .方差 分 析 .试验 设计 后 的 数据 尹 伯 等 都 可 闵 归 为 这 种 模型 
的 统计 分 析 . 


(一 ) 恋 轩 > 站 的 直 石 芷 亚 
2 并 是 一 II 加 HJ TB 过 大 人 外 


变量 之 间 如 果 不 是 毫 无 联系 ,那么 它们 之 间 的 关系 可 以 分 为 


TFER 工 上 -JU 下 上 TA 人 ww 【 -3A 2 一直 呈  A 


两 种 失 型 :确定 性 关系 (或 称 项 数 关 系 ) 与 相关 关系 . 
确定 性 关系 是 某 些 变量 值 确 定 以 后 另 一 些 变量 的 值 就 可 以 完 


Co Me 


全 被 确定 的 关系 . WE 在 一 个 阻 值 为 民 的 电阻 上 加 
电压 U, 则 电流 一 定 是 [一 云 . 这 里 变量 工 的 值 被 变量 U 和 尺 的 


值 完全 确定 ,【 与 U 和 玉 有 

相关 关系 是 指 一 些 变量 的 值 确定 以 后 , 另 一 些 变量 的 值 并 不 
能 完全 确定 ,但 与 前 者 有 某 种 联系 ， 比 如 一 个 人 的 身高 与 体重 的 
关系 . 一 个 人 身高 越 高 ,体重 一 般 也 越 重 ,但 身高 与 体重 之 间 并 不 
是 严格 的 函数 关系 ,有 些 人 个 子 不 高 ,但 很 重 ,也 有 人 个 子 很 高 ,但 
体重 不 太 重 . 如 果 记 身高 为 r, 体 重 为 y, 则 我 们 可 以 用 姐 下 的 数 


一 hb -二 -一 下 > 人 一 FI 内 六 
学 表达 式 表 示 已 1 所 间 的 关系 : 


y 一 4 十 0 十 e 


其 中 e 是 一 个 随机 项 ,此 式 说 明了 刁 高 越 高 体重 也 应 越 大 ,但 可 能 
有 糊 机 摆动 e. 类 似 李 ,一 个 变量 > 对 多 个 变量 zl ,zs，…'zr 的 相 
闫 关系 一 般 写 作 

y 一 (ziyzay…wwZp) 十 e 
这 里 太 是 确定 性 范 数 ,e 是 期 望 为 零 的 随机 变量 . 


(二 ) 回 妇 分 析 
本 y 与 恋 量 zl ,zs ,…: 

4 之 间 的 关系 @. 

(1) 是 否 有 相关 关系 ， 即 ma ,zs，…，zy 的 值 定 下 以 后 ,y 的 值 
是 否 在 某 个 确定 的 范围 内 . 
(2) 落 有 相关 关系 ,如 何 找 出 适当 的 函数 /zi ,za，…,zn) 

y 一 丰 Cziyzz，…z) 十 e (1. 1) 
其 中 *e 在 某 种 意义 下 很 小 . 这 个 e 叫 柚 随机 项 或 随机 误差 项 , 它 是 
期 望 为 零 的 随机 变量 (如 果 Ee 冯 0, 我 们 可 以 把 (1. 1) 式 右边 改写 
成 LJ(Cziyzra， .。 ,Zp) 十 巨 ej 十 (e 一 下 e)， 以 e 一 EEe 作为 新 的 随机 误 
本 

) 如 果 得 到 的 关系 式 (1.1) 中 人 e 的 方差 很 小 , 则 有 


必 
亚 

人 5 、 
Sew 


yRA CTZ19，Z2，…9TZpM) 


称 此 式 为 回归 关系 式 或 经 验 公 式 , 它 可 以 用 于 预测 和 控制 . 
中 预测 :已 知 zzz ，…zs 取信 为 局 ,zz ， 求 相应 的 > 大 
约 是 多 少 . 比如 通过 分 析 知 道人 的 身高 与 体重 之 间 有 回归 关系 式 
VyAAQ4 十 DZ 
现 知 某 人 映 高 为 并 ,那么 我 们 就 知道 此 人 体重 大 约 为 a 十 bz". 
| @) 控制 :如果 变 量 之 1 9? 之 2 9? ”9 尼 b 是 可 以 控制 取 值 的 ,而 y 不 


JW 数理 统计 学 中 对 多 个 变量 yy19 yy29 ”9yVm 与 多 个 变量 之 19 之 29 ”9 尼 7 的 相关 关 
系 也 有 研究 ,一 般 列 人 多 元 统计 分 析 的 范围 . 


7 “十 -区 总 
LA 


能 直接 控制 ,y 2 之 间 有 回归 关系 式 (1. 2 )5 那么 加 
果 要 控制 y 在 区 间 人 4A,B) 内 则 可 利用 (1. 2) 的 关系 通过 控制 zi， 
zz,，…，,zp 来 实现 ， 比 如 通过 分 析 知 道 , 在 对 某 种 产品 表面 进行 腐 
蚀刻 线 时 ,腐蚀 时 间 z 与 腐蚀 深度 > 之 间 有 回归 关系 式 

3yRx4 十 bz ( 填 , 3 ) 
现在 要 控制 腐蚀 深度 > 在 区 间 (4A,B) 内 , 则 可 通过 控制 腐蚀 时 间 
Z 工 于 区 间 (C, 厂 ) 内 实现 . 


苯 济 | 摊 和 [MI 计生 和 有 险 和 上 和 栓 管理 本 作 和 特许 和 名 六 而 
JLNJ L INJI” As LA TAR 了 AN 本 ”As 中- 天 蕊 一 一 | 各 yl 一 ”HOU 
让 芷 TEA 了 上 朋 IAH 光 云 IIRo TILE 加 人 

站 性 包 人 锦 作 和 量 人 团 果 禄 天 天 和 儿 史 7 从 乙 球 字 、 化 学 、 生物 和 学、 经 


济 学 .社会 学 等 专业 的 理论 常 币 只 能 得 到 一 一 些 定 ， 的 看 法 ,有 时 连 
定性 的 看 法 也 得 不 到 . 数理 统计 学 的 基本 手段 是 从 数据 出 
这 些 问 题 , 换 人 句 话 说 ， ,有 是 通过 调查 或 进行 科学 实验 获得 大 量 数 据 并 


一 一 SS Ya aa na ee 


在 此 基础 上 进行 科学 的 分 析 以 回答 上 述 要 研究 的 问题 . 


回归 分 析 需 要 的 数据 可 以 列 成 一 个 表 ， 见 表 1. 1. 


TU -一 有-/ 





咏 m1 证 大 2 吃 mbp .yn 





其 中 外 是 i 和 王妃 1 一 工 i2 9 ”人 泪 人 2,…,2) 时 的 y 的 


观测 值 ,一 般 要 求 观测 值 数 :大 于 目 变 量 的 个 数 娟 . 


全 一 回归 分 析 的 两 种 观 天 
\ 一 LJ MIRJPITT 


回归 分 析 的 出 发 点 是 表 1.1 那 样 的 数据 . 这 里 变量 > 一般 


了 国人 
OU 


是 不 能 人 为 控制 其 取 值 的 ,只 能 通过 观测 得 到 ,图 归 分 析 中 把 它 
作为 因 变量 . 变量 rz,z,…，*z 有 些 情况 下 可 以 人 为 控制 取 值 ， 
有 些 情 况 下 也 只 能 观测 得 到 . 由 此 就 产生 了 回归 分 析 中 的 两 种 
观点 ， 


把 自 变 量 二 | 
\ 上 /世上 月 义 时 过 1y 29” 9? 导 看 成 非 随 机 的 普通 变量 ,四 之 里 少 


看 成 随机 变量 ， 和 如 果 TI19-T29 9 人 7 的 取 


下 和 


值 是 人 为 控制 的 , 则 这 种 观点 比较 自然 ?如 果 mm ,zs ，……,z， 的 值 是 


观测 得 到 的 , 因 得 到 的 数据 仍 与 可 以 控制 时 同样 具有 表 1: 1 那样 
的 形式 ,所 以 这 时 也 完全 可 以 用 第 一 类 回 妇 来 处 理 . 
(2) 把 吉 yz yz 与 .y 都 看 成 随机 变量 ,这 称 为 第 二 类 回 


归 分 析 . 如 果 二 ,z ，:。 5 是 观测 得 到 的 ， 则 这 种 观点 比较 目 然 ， 


但 实际 工作 中 人 们 一 般 还 是 用 第 一 类 回归 分 析 来 处 理 . 
吧 关 PP 外 -LTF 般 还 是 用 第 一 从 回归 分 : 


我 们 将 主要 讨论 第 一 类 回归 分 析 , 关 于 第 二 类 回归 分 析 只 作 
简单 的 讨论 . 我 们 将 指出 ,在 许多 情形 下 ， 两 类 回归 分 机 有 相同 的 
计算 公式 . 

(四 ) 线性 回归 分 析 与 线性 模型 

回归 分 析 的 基本 问题 是 ， :如 何 从 表 1. 1 那样 的 数据 出 发 找 


本 下 niE 本 “一 一人 了 


2 


最 小 ? 
函数 的 可 选 范围 太 广 了 ,难以 下 手 . 如 果 预 先 假定 三 是 线 
性 浮 数 : 
J 
(bo 0， 0 均 未 知 ), 则 模型 (1. 1) 变 成 
y 一 Du 十 bi 十 本 OpZ5 二 e 《1. 4) 
回归 模型 结合 表 1. 1 的 数据 可 得 如 下 关系 式 ， 
一 加 十 bz 十 bl 十 … 十 OpZip 十 el 
yo 一 bo 十 ba 十 DZzz 十 … 十 DZ 十 es 


pv -ay Ab EL 
惟一 /余人 示 


(1 . 5 ) 


人 一 Du 十 0 元 本 十 …. 0 区 


称 之 为 线性 模型 . 
线性 回 妇 分 析 的 基本 问题 就 是 如 何 确定 py，Oi 9 ”” 0 使 得 

(1.4) 中 的 e 在 茶 种 意义 下 最 小 . E 
线性 函数 是 极 特 殊 的 多 元 函数 ,但 线性 回归 分 析 却 是 回 妇 分 


三 


时 二 到 里 女 有 JJc 志 / 胸 RPbh 丰 这 征 岂 让 人 会 开 际 央 月 一 :区 了 后 力 
模型 在 数学 上 有 成 熟 的 处 理 方 法 ,线性 代数 的 工具 可 以 发 挥 其 强 


大 的 威力 ,这 一 点 在 本 章 中 将 充分 表现 出 来 凶 实际 当中 不 仅 是 
经 常 遇 到 线性 回归 模型 ,而 且 许 多 非 线 性 回归 模型 经 过 和 通 当 的 恋 


ai 有” Le -9 < 一 工 本 


换 可 以 化 为 线性 回归 模型 这 一 点 现 作 如 下 解释 . 
*“ 例 古 1 在 彩色 显影 中 ,根据 以 往 的 经 验 ,染料 光学 密度 y 与 


站 


析出 银 的 放学 密度 z 之 间 有 下 面 类 型 的 关系 


YA Ace -B zf 另 僵 0) 
其 中 A,B 未 知 . 人 与 之 间 不 是 线性 关系 ,但 令 三 ln y， 
总 = 二 , 则 
六 下 4A 一 Bz- 
即 ”与 zx* 有 近似 的 线性 关系 ，_ 
一 般 地 ,一 元 多 项 式 回归 模型 常 可 化 为 多 元 线性 回归 模型 
如 设 
yy 一 加 十 bz 填 … 十 bzt 十 e 
则 只 要 令 zi = 了 忆 (1 王 1, 2，…，) ,就 有 
y 一 bo 十 DZ 十 … 十 Do 十 e 


即 多 元 线性 回归 模型 . 
上 述 方法 还 可 以 推广 . 设 
0 (1. 6 ) 
其 中 了 是 连续 函数 , 它 可 用 多 项 式 
DCZ1yZ2 5Tp) 一 2 Q(21 1 ,2 ) 工 工 工 中 … ， 


十 12 十 … 十 2 委 7 


来 逼近 . 志 人 一 工人 并 吕 工 , 则 
DZ1 2 9 一 1 Q(zl 记 二 1 


1] 12 人 1b 
9 2 ， “全 0 
六 魏 m 


是 新 变量 {z ，-，)} /的 线性 函数 ,于 是 可 以 用 线性 回归 模 理 


(zlyza，…zp) 十 5 来 近似 模型 (1.6)， 


1 9v<2D 5 是 六 


更 一 般 地 ,对 于 模型 


y 一 Q 人 CCZ1Z2 0) 十 e 


全 7 广 7 
7 了 一] 


只 要 屹 是 已 知 果 数 , 则 令 
2 (一 1 2 7) 


td 方 
再 


便 有 
7 一 ao 十 之 zi 十 
成 为 线性 回归 模型 . 
综 上 所 述 ， ,线性 回归 模型 的 应 用 是 十 分 广泛 的 . 为 了 便于 理 
解 ,下 面 先 介绍 一 元 线性 回归 ,然后 系统 讲述 线性 模型 的 一 般 理 


讼 .最 户 且 休 计 论 维 性 同上 归 癌 ] 昕 


yt 也)/ 口 闪 症 人 Lo -AL -一 /一 全 。 


8$2 一 元 线性 回归 


(一 ) 问题 的 提出 

在 一 元 线性 回归 分 析 里 ', 我 们 要 考察 的 是 :随机 变量 y 与 普 
通 变量 z(> 和 z 也 可 写成 YY 和 X) 之 间 的 联系 . 对 于 x 和 y，, 通 过 
观测 或 试验 得 到 若干 对 数据 

(zy (za yo) (zsyyn) 

在 此 基础 上 ， 如 何 获得 > 对 的 经 验 公式 呢 ? 先 看 一 个 例子 . 

例 2.1 某 种 合成 纤维 的 强度 > 与 其 拉 伸 倍数 zx 有 关 ， 表 
2 1 是 24 个 纤维 样品 的 强度 与 相应 的 拉 伸 倍数 的 实测 } 己 录 望 


找 出 强度 > 与 拉 伸 倍数 工 的 近似 关系 却 . 


| 
Oo 
CD 


表 2.1 合成 纤维 数据 


编号 。 拉 伸 倍数 强度 y | 编号 。 拉 伸 倍数 z 强度》 
1 1.9 1.4 站 13 5. 0 5.5 
2 2.0 1.3 | 14 5. 2 5.0 
3 2. 1 1.8 | .15 6.0 5.5 
4 2.5 2.5 | 16 6. 3 6.4 
5 2 2.8 | 17 6. 5 6.0 
6 7 25 | 318. 人 5. 3 
7 3.5 3.0 19 8.0 6.5 
8 3.5 2.7 20 8.0 7.0 
9 4. 0 4. 0 21 8. 9 8.5 
10 4.0 3.5 | 22 9.0 8.0 
2 8. 





我 们 以 (z,y) 为 坐标 把 这 24 对 数 画 到 平面 直角 坐标 系 内 ( 见 


图 2) , 称 这 样 的 图 为 散 点 图 . 从 图 2 中 可 以 看 出 ,这 些 点 大 体 上 散 
布 在 某 条 直线 周围 ,这 说 明 强 度 > 与 拉 伸 倍数 zx 之 间 大 致 星 线性 


10 


00 


强度 》 


-<- 忆 mi ww nn 小 


人 





拉 伸 倍数 x 
图 2 纤维 强度 与 拉 伸 倍数 . 


关系 : 

y 一 QQ 十 0 十 e (2. 1] ) 
其 中 e 是 随机 项 ,a 和 0 是 未 知 的 参数 . 下 面 的 问题 就 是 设法 取 a， 
使 e 在 某 种 意义 下 最 小 .我们 先 讨论 一 般 方法 ,然后 再 来 解决 这 
个 例子 的 问题 . 


(二 ) 最 小 二 乘法 


因为 从 图 中 可 以 看 出 散 点 都 接近 某 一 条 直线 ,因此 就 想到 应 
取 aa, 使 直线 > 一 a 十 pz 最 接近 图 2 中 的 24 个 点 . 怎样 衡量 一 条 


直线 y 一 4 十 pz 与 72 | 个 点 (Zi ， y1 ) ，( 工 ? ， Vy2 ) ，。 。… (大 ,yy ) 的 接近 程 


FEDIPRo2 THFH 
J/ 芭 /CC -JJ 门 jJ 


了 


开 


Q(a,0) 一 > (大 一 (十 pz) (2.2) 


1 一 1 


的 大 小 来 刻画 . 它 是 直线 与 各 散 点 在 垂直 方向 ( 纵 轴 方向 ) 上 的 上 距 
离 的 平方 和 . Q(a,6) 越 小 , 则 直线 >= 王 < 十 bz 越 靠 近 所 述 的 ”个 
点 . 因此 只 要 取 a,5 使 

Q(a;p) 一 minQ(a，,p) (2. 3) 


GD 


点 时 以 很 千 近 FH sr 二 册 六 一 一 工作 人 一 7 N_ cr 
AN JJ AT KK 汰 E 包 LUL。 1 让 过 个 JJ /人 不 HA 人 AE JR /7 于 


下 
,通称 最 小 二 乘法 ， 认 思 是 使 平方 和 量 小 的 参数 估计 方法 这 样 
得 到 的 <a,2 称 为 wa,p 的 最 小 二 乘 估 计 . 
定理 2.1 对 ?2 对 值 (zi ，V1 ) ，( 开 ? vv (zy ) 如 果 z ， 


NA 9\Vy2 7/ ” > Na 下 2 Ts 上 了 


zz zu 个 全 相等 , 则 a,2 的 最 小 二 乘 佑 计 为 
4 一 了 一 0 区 


半生 人 二 > 六 由 妇 
RJ C， 


关 
> 要 


< 


>》 人 
5E 二 一 -一 一 (2. 4) 


(Z; 一 元 ) 


PP 


其 中 艺 是 Ziy… ”9 之 7 的 平均 值 ， yy 是 yi，， ”9 yn 的 平均 值 . 


证 明 ， CCa,D) 本 > (yy 上 (aa 十 pz) 六 


i 一 1 


开 


= 2 (0 一 习 二 一 (十 好 四 一 六 (zx 一 元 )} 


汪 =- (六 一 妨 2 十 mLy 一 (ea 十 时) 了 十 


2 Se 一 丈 )? 一 20 > (入 一 习 (zi 一 工 ) 
一] :一 1 





志 
1. 一 》 (7z; 一 工 ): 
< 本 
人 
“323 2 AN: 7/ 
i 一 1 
7 二 SN 二 1 
Lzry 一 /下 民 i - 必 ] Vi 7 
;一 1 
则 
Q(Ca, 思 一 1 十 na[7 一 (十 时 ) 十 下 1 一 2 于 
1 2 A 
= 和 十 n[L7 一 (十 好) 并 十 (6 一 产 ) 一 产 
多 
全 一斑 
要 使 Q(a,0) 达 到 最 小 值 必须 且 只 须 
一 4 十 pz 
SS 
2 
一 
< 
》 【六 : 一元) 
1 ? 
因此 a,6 的 最 小 二 乘 估计 为 (2. 4) 中 的 2,5. 证 毕 
本 


& 十 0 (2. 5 
其 中 cc, 由 (2.4) 式 确定 . 在 符号 > 上 加 的 帽子 记号 是 为 了 区 别 
于 y 的 实际 值 . > 叫做 对 应 于 z 的 回归 值 ,(2. 5) 式 叫做 回归 方 


。 1896 。 


区 


程 , 由 回归 方程 决定 的 直线 叫 回归 直线 . 
对 于 例 2. 1 的 数据 ,用 (2. 4) 式 可 以 算出 
关 一 0. 859 ,4 一 0. 15 
因此 ,强度 > 与 拉 伸 倍数 z 之 间 的 经 验 公 式 ( 匡 归 方 程 ) 为 


y 一 0.15 十 0. 859z 


这 里 回归 系数 2 佑 计 为 0.859 的 意义 是 , 拉 伸 倍数 每 增加 一 个 单 


一 全 上 省 ma 一 


位 ,强度 平均 增加 0. 859 个 单位 
性 关系 的 检验 


《2.5) 后 ,是否 驶 可 以 用 它 来 进行 预报 和 控制 了 


有 了 经 验 公 式 
ID SS 人 TV 让 癌 呈 rTHH 1 FA AAA 上 HA 人 OIL 二 沙 fr 了 了 
MAC ， JI 站 人 过 9 人 /二 1 除 要 求 各 过 ; 不 全 禄 等 以 外 双 评 A TD 三 


2. 1 
9 此 给 了 任何 一 组 数据 (zi yi)， (zsy，ys)，， 
\ 式 (2. 4) 来 计算 最 小 二 乘 估 计 a,o 从 而 得 到 y 
一 个 经 验 公 式 二 ,这 并 不 时 日 日 蕊 > 之 后 | 直 圳 激 个 [上 和 


一 全 
个 H 之 < 一 1 | 从 及 ， 过 和 开 人 人 肛 二 访 志和 二 疯 呈 人 过 和 有 


线性 关系 . 如 果 回 归 值 与 真实 值 之 间 的 差距 即 拟 合 误差 > 一 > 确 


As T iv ns ， 人 直立 必 一 TI  、 之 间 的 确 存 在 线性 相关 关 
实 孝 比较 小 ,我 人 中 且 以 认为 . 本 之 二 上 网 上 有 JJ 鲍 付 任 区 二 人 大 大 


上 


和 eenmn 合 验 . 
我 们 先 证 明 一 个 具有 统计 芥 义 的 平方 JrFrv An 解 公 式 
引 理 2.1 令 
人 
Yi Ci CiNLZ 工 9 愉 9 9 AZ 7/ 
其 中 ap 为 最 小 二 乘 估计 , 则 
1， 一 QT 二 U (2.6) 
其 中 
上 
《yy? Lv: / 
一】 
叫 y 的 总 离 差 平方 和 ， 
C 一 (yi 一) 
1 一 1 【 
叫 残 差 平 方 和 ， 


大 


U 一 >)(y 一 刀 ? 
一】 
叫 回 归 平 方 和 . 
证 明 :; 2 二 > (y 一 忆 ? 


| 


2 一 六 ) 十 (y 一 了 ?下 


大 


和 
人 LA、 ~: LA ~ 
1 一 1 1 一 ] 


0 一 沁 )(y 和 ) 


2 AP 
1 一 二 





其 中 交叉 项 
吧 二 本 
一 0 
E = 本 
= fy 一 7 一 5 ][5(z; 一 互 )] 
i 一 1 
一 0 一 以) 
一 访 .( 佐 一 有 
| 
人 1 
故 (2. 6) 式 成 立 . 证 毕 . 


(2.6) 式 左边 的 /反映 了 yy，…y 这 27 个 值 的 分 散 程 
度 ,(2. 6) 式 说 明 2 可 以 分 成 两 部 分 Q 和 U,U 是 拟 合 值 yi 一 1， 
这 一 部 分 平方 和 可 以 得 到 回归 式 的 解释 . Q 是 拟 合 残 差 的 平方 和 ， 
它 反 映 了 回归 直线 与 观测 数据 的 接近 程度 ,Q 越 小 ,说 明 回 归 的 歼 


1 小 (相应 
不 上 培 灯 ， 回 册 人 性 /的 这 两 部 分 中 , 当 人 所 占 的 比例 相 汉 / 下 日 AM 


地 ,U 所 占 比例 相当 大 ) 时 ,原来 的 数据 中 的 近似 的 线性 关系 才 比 


JRR ， 
”OO 


较 可 信 . 因此 我 们 用 比值 CQVQ 的 大 小 来 衡量 线性 相关 关系 的 可 
信 程 度 ,这 个 比值 越 大 ,我 们 越 有 把 握 说 两 变量 之 间 确 实 存在 线性 


相关 关系 . 
为 了 建立 统计 上 的 假设 检验 ,需要 先 作 一 些 数 学 上 的 假定 . 
设 数据 (zi,y)7 有 下 列 绪 构 
凡 二 Q 十 bx; 十 el (0 一 1 2，…，72) 《2.7) 
其 中 el,ez， ev 为 独立 同 六 (0 人 ) 分 布 骨 的 随 机 变量 ( 喧 过 0 未 
类 ). 我 们 来 检验 假设 
HT, :0 一 0 (2. 8) 
如 果 和 否定 了 H。, 就 说 明 y 与 x 之 间 有 线性 相关 关系 ;如 不 能 否定 
万 , ,说明 从 现 有 数据 出 发 不 能 认为 y 与 线性 相关 . 对 五。 的 检 
验 叫 相关 性 检验 ， 当 于 ,被 否定 时 , 称 回归 方程 (2. 5) 是 显著 
的 . 令 
F 一 亲 7 (2.9) 
可 以 证 明 ( 见 》5) ,在 五 。 下 下 服从 自由 度 为 (1,2 一 2) 的 开 分 布 . 
取 人 否定 域 
凡 一 ( 产 盖 和) 
其 中 为 下 (1,2 一 2) 分 布 的 1 一 ac 分 位 数 ,a 为 检验 水 平 . 实际 计 
算 下 时 ,可 用 下 列 公 式 
口 一 0/ (2. 10) 
Q= /一 U (2. 11) 


其 中 第 二 式 由 (2. 6) 式 可 得 ,第 一 式 是 由 于 


UJ 一 》 (六 一 7 


现在 回 到 例 2. 1 上 来 . 用 统计 量 (2. 9) 进 行 相关 性 检验 ,计算 
得 了 节 一 436, 查 上 分 布 表 得 自由 度 为 (1,227 时 0.95 分 位 数 为 
4. 30. 而 生 >>4. 30, 故 应 否定 互 , :2 一 0, 即 强度 y 与 拉 伸 倍数 z 之 
间 确 实 存在 线性 相关 关系 ,回归 方程 > 一 0.15 十 0.859z 可 以 用 于 


了 TV 兹 8 生 Ac 日 出 和 
J 人 从 、\、] 工 内 -可 月 昌 J)， 


(四 ) 相关 系数 


在 实际 工作 中 ,要 判断 变量 y 与 变量 z 之 间 的 线性 相关 性 ， 
人 们 还 常用 y 与 z 的 样本 相关 系数 


8 _A sw 


2 一 工 )y 


2 一 元 ) 2 一 怀 )? 
来 衡量 . ”是 把 > 和 ~ 看 成 随机 变量 时 其 相关 系数 的 矩 估计 ， 我 
们 知道 两 个 随机 变量 > 和 xz 的 相关 系数 o(Cz,y) 取 值 在 [一 1,1j 
内 ,zy,y 独立 时 o(z,y)=0, 而 yy 与 z 可 以 互相 线性 表示 时 
1oCz,y)| 一 1,|oCzy)| 的 大 小 代表 了 > 和 <z 的 线性 相关 性 的 强 
弦 . 虽然 这 里 我 们 把 z 作为 非 随 机 的 普通 变量 ,我 们 还 是 可 以 用 
佑 计量 ”来 作为 y 与 过 的 线性 相关 性 的 度量 . 

对 一 元 线性 回归 ,我 们 还 可 以 建立 > 与 回归 平方 和 U、 残 差 平 


LA 一 生 户 一 am -Ze 一 T 全 -全 ro 一 个 


方 和 Q 和 总 离 差 平方 和 /之 间 的 关系 : 

















/yy， /yy 


彤 
所 以 半 是 回归 平方 和 TU 在 总 离 差 平 方 和 / 


LA 2 FL 4 


说 明 > 与 线 性 相关 性 越 强 . 


ee 了 OO 。 
工 vv 


-与 最 小 二 乘 估 计 2& 还 有 如 下 关系 


Eee 全 
0 
-~ 与 (2.9) 的 下 统计 量 关系 为 


六 


《1 二 殊 /Caz 一 2) 


芍 对 五 .0 一 0 的 检验 本 通过 7 进行 ,但 临 男 值 仍 根据 上 式 用 丰 

AAAJ es0sL vv RE Ad 人 YL TMPHEVJI YL LA/J 
生 修 、 的 读者 可 能 注意 到 在 用 统计 量 天 栓 了 玲 个 设 刀 .0 时 我们 用 到 | 
-本 儿 电 区 和 是 二 J? 人 证 /天 公馆 富阳 尺 0302 vv HH 用 JJ 填 J 


了 关于 模型 (2.7) 的 “假定 ”: 随 机 项 el ,es ,…，,e, 相互 独立 同 分布 , 共 同 分 布 
是 N(0,o)(c 未 知 ). 如 何 根据 数据 (zy)(G= 一 1,…,29 判 别 这 个 “假定 ?是 
否 成 立 呢 ? 这 又 是 一 个 检验 问题 . 令 .e 一 关 一 和 Ci 二 1 72)， 这 里 入 一 4 十 
bzi Ca 分 别 是 a 池 的 最 小 二 乘 估计 ). 这 些 e 叫 作 残 差 . 令 





7 一 一 一 一 一 《一 1，…72)， 
II V 1 一 几 ， 
其 中 
PR | 
- Q _ 工 工人 za 一 工 ) 
昌 人 72 2 
QQ》 (一 站 )2，1 一 (zi 一 元 ): 
LN 一 4 


数学 上 可 以 证 明 55 ,如 果 上 述 * 假 定 ? 成 立 , 则 六 ,…,% 近似 地 相互 独 
太 布 . 自  _ 玫 II 产 直 


一 一 呈 


从 而 在 


全 和 一 


立 , 且 各 和 近似 地 服从 标准 正 态 分 
有 [L0. 95z 个 7 满足 17 | 委 2 

反之 , 石 根 据 数 据 计 算出 加,，…，,，, 后 发 现 满足 不 等 式 |% | 委 2 的 7 的 
个 数 与 [0. 95 由 差别 很 大 , 则 表明 上 述 的 “假定 ?不成立 , 即 不 能 认为 模型 
(2.7) 的 随机 项 el ,ez ，……,e* 是 相互 独立 同 分 布 的 且 共 同 分 布 是 N(0,c ). 这 
时 用 统计 量 上 检验 瑟 。 :2 一 0 就 缺乏 根据 了 . 

只 要 上 述 的 假 乍 ?未 被 否定 ， 我 们 就 认为 “假定 "成立 . 这 方面 的 深入 研 

究 属 残 差 分 析 的 范围 ,参看 [15]. 


(二 古 党 | 
\JL jj 区 必 ] 


有 了 回归 直线 , 当 目 变 量 z=zo 时 ,相应 的 y 是 多 少 ? 目 然 


。 了 9 。 


所 
S 
并 
如 
亏 
> 
表 
订 


用 一 a 十 pzo 去 预测 yx (也 二 说 用 y% 作为 w% 的 估计 ). 这 里 要 注 
意 的 是 ,由 于 y 是 随机 变量 , 故 y% 不 是 第 二 章 中 对 参数 的 估计 ， 
而 是 对 随机 变量 的 估计 .我 们 也 可 以 构造 % 的 置信 区 间 . 可 以 证 
明 ,在 一 定 条 件 下 ( 见 第 5 节 ). 

0 0 


VdQ7]/(Cn 一 2) 


7 2 
有 1)》. 从 分布 表 中 可 找到 临界 仁和 满足 
| 生性 全 1 
于 是 可 得 % 的 1 一 ae 水平 置信 区 间 
[一 VC7G 一 ,为 二 VaQ7GE2] (2.12) 
当 自 变量 ze 在 横 轴 上 变化 时 ,置信 区 间 的 上 .下 限 的 相应 变 
化 形成 双 曲 线 ( 如 图 3 所 示 ). 





例如 ,a 王 0.05 时 ,针对 表 2.1 的 数据 ,一 24, 和 一 2.074，,/ 
一 152. 3 


二 2 
0 
24 15253 


于 是 % 的 置信 区 间 是 


。 192 。 


| 二 5 (一 313)7 /25 ， (zz 一 5 ED 靖 


De 歼 十 Te 3 De 列 十 本 3 
(置信 水 平 是 0. 95). 
(六 ) 控制 
LA 人 册 记 -二 [和 4 TD |] rr， 一 TI (HE 
如 果 想 使 : .0 落 在 给 和 冠 ， 的 范围 LA D 症 PPMyZo 以 取 天 上 人 人 但 


这 就 是 控制 问题 . 从 (2. 12) 知 道 ， 若 要 以 1 一 a 的 概率 保证 y。 取 





值 在 LA， BJ 内 ， 则 Zz 必须 且 只 只 需 满足 不 等 式 
4 十 pzo 一 MAVdQ/ (Cn 一 2) 之 人 


RE 
解 土 述 不 等 式 (注意 4 也 是 ze。 的 函数 !) 可 以 得 到 zoE [CC:]. 
从 图 3 看 出 ,C, ,C, 分 别 是 >“=A,y=B 两 条 直线 与 双 曲 线 的 交点 
的 横 坐 标 . 在 有 些 情况 下 ,如 果 [A,B] 过 窗 , 则 满足 上 述 不 等 式 的 
zz 不 存在 . 
(七 ) 一 元 齐 次 线性 回归 
在 某 些 实际 问题 里 , 根 事 物 的 实际 情况 ,在 研究 线性 相关 性 


RE DT 人 人 肯定 “常数 项 ”是 | 防 考 虑 下 列 模 型 


本 J “JJ 2A 电 人 改作 LA AN /JJ 天 一 。 
YY 一 DZ 十 e 时 (2， 13) 
二 4 一 一 上 哺 机 项 了 ~ 人 八 
蕉 本 6E 自 了 哺 人 入， 姜 E 一 ~， 
设 有 数据 (zl yy )，…，(CZzoyyn) , 如何 估计 系数 2? 和 前 面 一 


样 , 应 找 使 平方 和 > (一 红 达到 最 小 值 . 易 知 当 且 仅 当 0 一 
时 这 个 平方 和 达到 最 小 值 ,这 里 


六 








力主 0 
0 = 一 - (2. 14) 
汪汪 
这 个 5 仍 叫 作 2 的 最 小 二 乘 估计 . 于 是 有 回归 方程 
7 (OO TRY 
VOL Le 人 


这 个 方程 是 否 有 意义 呢 ? 还 应 检验 假设 责 。 :2 王 0. 只 当 这 个 假 该 


。 了 93-。 


针 拒 绝 时 LA 程 (2. 15) 才 有 意义 , 才 可 用 来 进行 预测 或 控制 . 

怎样 检验 瑟 o:2=0 呢 ? 和 以 前 一 样 , 应 假定 数据 有 下 列 
结 
下 全 


na FE ”二 Di 下 Xi 一 9 十 上 -在 ~- 上 2NAN7 -全 廊 m 
过 主 617 5389” ”En 4 介 亏 包 充 喇 帮 4 丰 辐 - 刀 4HE 人 Y 0 /人 可 不 人 1/， 


(0 
显然 ， 在 五 ， 下 19 yz 9 9 Vn 独立 同 分 布 , 共 同 分布 是 人 0， 


o). 于 是 了 与 2 一 了): 相互 独立 ,5 光一 N(0， 1) , 坪 有 > ov- 


>y) ~ (2 一 1). 从 而 统计 量 


一 2 
F=-- nr (2. 16) 
2 一 )271(2 一 1) 


眼 从 第 1 自由 度 是 1 ,第 2 自由 度 是 zx 一 1 的 下 分 布 .因而 在 贡 , 下 
查 下 分 布 表 有 临界 值 4 满足 PCF>)) 一 w 所 以 在 下 的 值 大 于 1 
十 6 和 FT 此 时 所 得 到 的 回归 方程 本 是 有 闪 YA。 
号 JJ JJ 二 一世 0 上 已 帮 JJ/ 本 工 J 有 JJ /到 AR 有。 

例 2.2 ” 哈 勃 定律 是 20 世纪 最 惊人 的 科学 发 现 之 一 , 它 说 明 
二 站 > 一 一 -HG HI 各 尾 系 在 以 巨大 三 | 多 三 | 
本 由 性 肛 / 朋 健生 泵 仁 世 已 大 的 速度 彼此 分 离 . 以 “和 ”| 生 


系 相 对 于 另 一 任意 星系 的 速度 ,d 为 此 二 星系 之 间 的 距离 , 则 哈 亏 
定律 为 
一 万 过 


其 中 互 称 为 哈 勃 常数 . | 
表 2.2 列 出 了 11 个 星团 距 太阳 系 的 距离 和 相对 速度 ,我 们 由 


琳 一 一 一 0.03o 44 





图 4 为 11 个 点 及 回归 线 v 一 0 035 44d. 
。 194 。 


心 
定 


玉 


速度 v( 干 类 里 / 秘 ) 





0 500 1000 1500 
让 离 4 ( 百 万 光 年 ) 
图 4 哈 勃 定律 
利用 (2. 16) 可 算出 统计 量 下 王 14. 69 , 查 布 表 知 下 (1,1 
的 0. 95 分 位 数 是 4. 96 现在 下 这 4. 96. 故 所 得 到 


有 
旬 





飞 马 座 68 2. 4 
英 仙 座 108 3. 2 
后 发 座 137 4. 7 
大 熊 座 一 号 255 9. 3 
狮子 座 315 12.0 
北 晃 座 390 13. 4 
双 了 于 座 405 14. 4 
牧夫 座 685 24. 5 
大 熊 座 二 号 700 26. 0 
长 蛇 座 1100 38.0 


中 ”英里 为 非法 定 计 量 单位 ,1 英里 这 1 609. 344 米 . 


。 了 9 。 


论 , 哈 勃 定律 是 大 爆炸 的 结果 ,而 哈 勃 常数 的 倒数 则 是 衬 宙 的 年 
上 AN 注音 上 再 仁 由 的 阿 讽 首位 上 且 站 用 / 业 人 和 件 。 和 入 管 灿 秒 -1 户 
外 < {LLAenN_L HU [上 LUIHJ 二 JJ -人 LA 人 -六 -/ ] LU- 9 JP AL /上 
-Te 和 Don 日 opAiRTIALEFEEHAKE 由 但 
可 由 天 此 违 于 由 半生 辟 ， 表 42 征 44 证 代 碍 动 厅 用 的 辫 莉 ,由 山竹 


到 的 宇宙 年 龄 是 52 亿 年 左右 . 由 于 现在 测量 星系 间距 离 的 技术 有 
了 很 大 改进 ,所 以 用 现在 的 数据 算出 的 宇宙 年 龄 约 为 150 亿 年 . 
例 2.3 ”哺乳 动物 出 生 后 开始 走动 的 时 间 z 与 开始 玩 于 的 时 
间 > 是 有 关 的 ,有 许多 学 者 研究 过 这 两 者 的 关系 . 表 2. 3 列 出 了 
11 种 哺乳 动物 开始 走动 的 时 间 与 开始 玩 村 的 时 间 的 数据 ， 画 出 
散 点 图 后 ,可 以 看 出 数据 点 好 像 落 在 类 似 > 一 az 的 寡 曲 线 周 围 . 
令 yi 一 lnyoz= 一 ln 对 yz: 进 行 线性 回归 拟 合 得 回归 
方程 
y 一 1. 689 十 0. 561z 《2. 17) 
相当 于 
yy 一 5. 4270.561 (2. 18) 
(2. 17) 式 对 应 的 正统 计量 为 27. 438, 在 水 平 0. 000 5 下 方程 
(2. 17) 是 显著 的 . 


加 开始 走动 时 间 开始 玩 责 时 间 


和 z( 天 数 ) - y( 天 数 ) 
人 360 90 
大 猩猩 165 105 
猫 21 21 
家 大 23 26 
挪威 鼠 11 14 
乌 秽 18 28 
混血 猕 儿 18 21 
蛙 猩 猩 150 105 





种 “ 别 开始 走动 时 间 开始 玩 要 时 间 


z( 天 数 ) (天数 ) 
松鼠 猴 45 .68 
伦 鼠 45 75 
日 脸 猴 18 46 


如 采 直 接 对 ww 和 拟 合 最 小 二 乘 估 计 得 回归 直线 


”_ 口 恋 


y 一 35. 81 十 0. 234 7 工 (2. 19) 
对 应 的 下 统计 量 只 有 9. 506 ,在 水 平 0. 01 下 方程 (2. 19) 不 显 


它 
著 ,在 水 平 0.05 下 显著 ,说 明 > 和 xz 的 关系 用 寡 函 数 表示 比 用 线 
性 关系 要 好 ， 从 图 5 也 可 以 看 到 这 一 点 . 


名 本 AL 号 ae / ”Re 


mm 
Gn 
C> 


Go 
定 
上 一 一 上 一 上 一 上 一 上 
@ 
\ 
\ 
\ 
1 


二 


l 


th mh 


开始 玩 要 时 人 间 (天 ) 
症 全 


> 
心 





呈 


《 





己 


100 200 300 400 


一 上 ， 和 的 一 一 全 


开始 走动 时 间 z( 天 ) 
图 5 哺乳 动物 开始 走动 时 间 与 开始 玩 要 时 间 


上 一 节 里 我 们 已 经 说 过 ,线性 回归 之 所 以 重要 ,不 仅 是 因为 它 
数学 上 容易 处 理 , 实 际 中 经 常 出 现 ,还 因为 实际 中 许多 数据 经 过 适 
当 变 换 后 可 以 化 为 用 线性 回归 的 形式 ,变换 的 选择 首先 应 靠 有 关 
专业 知识 ,如 果 有 关 专 业 知识 不 能 提供 这 方面 的 信息 则 可 由 数据 


散 点 图 的 形状 来 试 选 适当 的 画 数 对 应 的 变换 . 


一 元 多 项 式 > 一 ao 十 cz 十 … 十 asz* 总 可 化 为 多 元 线性 回归 


。 9097。 





。 了 96 。 


2 
E 
EN 
AN 
SR 
坷 
7| 





图 8 指数 画 数 y 一 ae 


图 10 因数 > 一 a 一 2/z(C 二 0) 
了 
中 


]/ 


] 
二 





让 


图 11 函数 y 王 ae “= (pbD0) 
。 109 。 


图 12 ”逻辑 曲线 y 一 天 二 -CO>0) 


$ 3 ”线性 模型 的 参数 估计 


(一 ) 线性 模型 
多 元 线性 回归 的 一 般 形 式 是 
y 王 序 十 Bi 十 … 十 BT 十 e 
不 失 一 般 性 ,总 可 以 设 有 =0, 因 为 可 以 形式 地 引入 目 变 量 zo 和 1， 


旋 


从 而 y= > pz; 十 e. 所 以 在 理论 研究 时 可 以 假定 
i 一 0 
y 一 BT 十 记 zo 十 … 十 Boz 十 e (3. ] ) 
多 元 线性 回归 的 出 发 点 ,正如 8 1 中 所 述 ,是 表 1.1 那样 的 数 
据 , 即 
之 11 忆 12 之 1 .yl 
之 21 忆 22 20 .yy? ， ， 、 
， (《D。2 ) 


其 中 .yy 是 Zi 一 ily7z 一 ii29 9 一 让 时 y 的 观测 值 (z 王 1,2， 


困 3 力 > 放 
ru/ 37 


我 们 假设 上 述 数 据 适 合 下 列 模 型 , 称 为 线性 模型 : 
。 2Z00 。 


人 V: 一 儿 之 11 十 有 Ziz 十 … 十 DZiy 十 el 
av 外 扩 ”人 到 


IE 0 ， (3. 3) 


一 记 Ti 十 Zoz 十 … Re 十 ev 


hrh 三 DDN- -Ai 二 
2 四 5 《ECI9C3 9 “Cn 是 随机 变量 (这 样 ( .3) 和 陈 中 的 1 ， y2 3? ”yn Lb 


看 成 随机 变量 ,而 (3.2) 中 的 wm ,yy 为 它们 的 观测 值 , 在 不 
引起 误会 的 情况 下 ,在 记号 上 不 区 分 随机 变量 及 其 观测 值 ) ,zs ， 
1 一 1,2,…，zp, 一 1,2,…，7 是 已 知 的 实数 ( 即 把 zl ,zz，…，Zzy 看 
作 非 随机 的 普通 变量 ) ,8 ,2 ,6 是 未 知 参 数 . 

对 随机 项 el ,ez ,，…，,e, 芝 作 下 列 两 种 假定 : 

假定 A， 达 ee: 一 0 (z 一 1] ,2，…，77) 

eieij 一 0 (天 7 

FE 一 o。(G 一 1,2，we7) 
其 中 c 为 未 知 正 数 . 

假定 B:e: ,ez,…,e, 相互 独立 同 分 布 且 ei 一 N(0,o), 其 中 


显然 假定 召 比 假定 A 强 , 线 性 模型 研究 只 要 不 涉及 假设 检验 


和 置信 区 间 rr FI EAIEAHN CE 人 A 


























个 H 则 月 必 II 本 人 凤 人 信 门 J | 以 人 上 人。 
为 了 表达 简捷 并 便于 使 用 线性 代数 的 知识 ,我 们 大 量 使 用 和 拖 
阵 和 疝 量 记号 . 记 
fy 1 (el 
Y 一 辆 , 入 一 (Zi ) ,xye 一 
| | 
p 
0 一 
同 
则 模型 (3. 3) 可 改写 为 


。 20 。 


Y 一 Xp+。 (3. 4) 


其 中 e 为 ” 维 随机 向 量 ,X 为 2X 娟 常数 阵 ， 为/ 维 未 知 参 数 向 
量 . 假定 A 可 表达 为 


1 有 人 La -上 上 一- 





达 e 一 0,Cov(Y ,Y) 一 go 
二 了 JU DA Crc 7 N 一 放 rr 由 一 字 - 一 2 大 ~ (Ho 二 门下 -= 七 
二 人 /了 寺 人 人 LCPTY vv 1 到 小 ss -7 有 由 万 在 了 时 ， 肌 二 志 人 友 
四 
0 . 
NT 。 ,IT ) 
0 
或 
Y 一 NGCX6,o 7) 
以 下 我 们 还 用 到 一 些 线性 代数 中 的 记号 . 设 a 为 R4 中 的 向 


量 ,M 为 尺 * 的 子 空间 , 则 记 |cj 为 a 的 长 度 , 记 Proj 为 向 量 a 在 
子 空间 M 中 的 投影 向 量 . 设 A 为 一 立 X& 和气 阵 , 则 ACA) 表 示 由 人 


的 下 个 列 张 成 的 及” 的 子 空 间 mm 有 旺 ” 丰 在 下 区 分 饮 
从/ 也 日 J 了 全 II 本 ，。， 星 4 惟有 月 下 久 妃 诗 


4 一 FrojaT 了 (一 Proja) 
其 中 (ae 一 Proja) 上 AM. 
(二 ) 线性 模型 参数 的 最 小 二 乘 估计 
下 面 人 和 比 性 枢 了 va 4) 中 人 参数 9 的 估计 问题 ， 有 了 一 


1 HU BILL DC 一、 了 7/ mV 上 了 了 


理 
论 ,不 仅 可 以 用 于 回归 分 析 ,还 可 以 用 于 方差 分 析 、 试 验 设计 、 数 据 


了 浊 人 名 bb 诡 、 LI 人 B 
三 1 有 等 多 种 统计 问题 . 


使 得 (: 3. 人 
的 想法 是 使 
SR ， 
QG8) = ty 一 (za 十 房 zi 十 十 Ba) 人 
ij 一 1 
一 才 Y 一 X8 有 (3. 5) 


。 Z020 。 


达到 最 小 . 
定义 3.1 对 线性 模型 (3.4) , 称 8 是 8 的 最 小 二 乘 估计 ,如 果 


对 一 切 898, 有 


ZJ 万 9 蝗 

Q(5) 二 Q(Cp) 
KR 关上 由 /性 了 TH >、 人、 请 一 人 -了 LAAm 2 -AH 了 - 诗 As 
人 凤 b 志 和 圭 [J 丰 j “最 小 二 乘 估计 的 存在 性 及 人/ 认 到 及 A 八 {A。 
定理 3.1 (〈1) 最 小 二 乘 估 计 一 定 存 在 . 


(2) 8 是 最 小 二 乘 估计 的 充 要 条 件 是 B 适合 方程 ( 称 为 模型 
(3.4) 的 正规 方程 ) 


X X8 一 和 了 (3. 6) 
证 明 :(1) 注意 到 X 的 各 列 张 成 的 线性 空间 A(X) 可 表示 为 
A(X) 一 {7ER":7 一 X8,8ERz) 


少 


上 一 Prol 工 
wz 
则 由 投影 变换 的 性 质 知 


上 7 一 引 委 | 一 Xp VpER 
而 6EALCX), 从 而 必 存 在 9ER* 使 Xp 一 <, 遇 


1 二 人 [LA 人 而 尼 1 六 人、 全 


了 一 Xi 和 ly 一 Xpl，YpER， 





即 
Qi 入 Q(p) ， VB8ER。 
因此 有 就 是 p8 的 最 小 二 乘 估计 . 
(2) 仍 记 和 一 Y, 则 若 X8 一 6, 当然 有 
Q( 人 <Q(0) ， VPRER: (3. 7) 
反 过 来 , 若 使 (3.7) 成 立 ,注意 到 


人 一 上 二 《人 一 人 
各 G | 大 C/ 


Y 一 X6 一 (e 一 Xp) 十 (Y 一 自 
上 7 一 XX8 杠 三 |‖ 一 拓 十 用 一 X8 
若 Xp 二 8 则 Q(8) 二 | Y 一 引 ,而 EAX)， 与 (3.7) 了 矛盾 , 故 必 有 
Xp 一 & 因此 (3.7) 成 立 的 充 要 条 件 是 
。203 。 


即 YY 一 XB8 | A(X)， 即 了 一 XpP 奉 直 于 X 的 每 一 列 , 这 可 表 为 


Se 


即 (3. 6) 式 成 立 证 毕 . 


注 ”我 们 可 专 不 用 线性 空 牛 
本 和 定理 的 初等 证 明 ， 4 
设 p=(P 5) ,从 (3.5) 知 、 
Q(p8) 一 (了 一 XB) (Y 一 XB) 一 (Y 一 XB 十 X(5 一 ))(Y 一 和 十 X(B 一 及 ) 
一 (Y 一 Xp) (7Y 一 X6) 十 (XG6 一 D) (CO 一 有 十 2(XC5 一 D) (7Y 一 XD) 
一 Q( 十 |X(5 一 0) 性 一 2068 一 DCXXB 一 和 YY). (3. 8) 
由 些 可见, 若 8 满 足 方程 (3.6), 则 QCp8) 之 Q(6), 即 6 是 8 的 最 小 二 乘 
估计 . 


我 们 指出 方程 (3. 6) 一 定 有 解 . 实际 上 ,线性 方程 组 (3. 6) 的 系数 矩阵 和 碗 : 


与 X 有 相同 的 秩 ,而 增 广 矩 阵 (XX,XY) 一 X(CX,Y) 的 秩 不 超过 X 的 秩 , 所 以 
增 广 矩 阵 与 系数 矩阵 有 相等 的 秩 . 依 线性 方程 的 解 的 存在 定理 , 知 方程 (3. 6) 
一 定 有 解 . 这 就 证 明了 最 小 二 乘 估计 一 定 存在 . 设 8 是 方程 (3.6) 的 任何 一 个 
解 ,6 是 58 的 任何 最 小 二 丢 估 计 , 从 (3.8) 知 QC8) 一 Q(Cp8) 十 上 X(CG5 一 及 用 由 于 
QGO) 委 Q(p) , 故 XGO5 一 永 =D, 即 X6 一 戎 ,从 而 居 戎 =XXP=XY. 这 表明 局 
一 定 满足 方程 (3. 6). 这 就 完成 了 定理 3. 1 的 初等 证 明 . 

顺便 指出 ， 本 章 和 定理 的 证 明 中 凡是 用 到 线性 空间 的 投影 理论 的 都 可 利用 
矩阵 知识 避免 比较 抽象 的 投影 理论 . 当然 ,* 投 影 理论 ”也 有 其 优点 :便于 从 几 
何 上 把 握 研 究 对 象 ,表达 简洁 , 且 便 于 推广 到 无 穷 维 空间 (时 间 序 列 的 研究 就 
涉及 无 穷 维 线性 空间 ). 

以 下 恒 用 8 表示 有 的 最 小 二 乘 估计 . 易 见 

Q(C8) 一 YY 一 YXH (3. 9) 
事实 上 , 因 Y 王 Xp 十 (Y 一 X6) ,所 以 
Q(C) 一 下 7 一 XP8 必 三 | 有 一 下 8 


> 


有 FA/ 拉 7 AAA 太 / 习 产 入 
一 工 工 一 久 和 入 6 
一 YY 一 YX 
最 小 二 乘 估计 可 能 不 唯一 . 不 过 下 面 的 推论 中 的 条 件 在 大 多 
”一 一 -TH 志 站 蕊 1” 姜 “人 人 汪 | HU NA JR YL HA 


数 情 况 下 是 满足 的 . 
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系 3.1 行 和 满 秩 ( 即 的 秩 等 于 如 ), 则 最 小 二 乘 估 计 唯 
一 且 
A 一 CN- AT LQ 110 
必 了 LA LA NA 莹 了 是 Ne 上 上 \AA 
Q(8) 一 Y (CT 一 XCXXD) -1X )Y (3. 11) 
了 昌 FEIY TASE 了 阁下 Y 过 [上 尾 rW 闪 \、 FU - 匠 一 一 
过 征 关 凡人 人 机 居间 人 人 人 傅 居 人 类 际 下 自生 二 /加 册 下 思 
程 有 了 唯一 解 (3. 10). 式 (3. 11) 只 要 把 (3. 10) 代 和 人 (3. 9) 即 可 
导出 


注意 现在 我 们 还 没有 用 到 假定 A 或 假 乍 呈 , 我 们 只 知道 一 定 


可 以 求 出 最 小 二 乘 估计 ,但 不 知 其 优生 性 如 何 . .正面 的 定理 为 了 
讨论 估计 的 性 质 就 使 用 了 对 随机 项 e 的 假定 入. 
定理 3.2，” 对 线性 模型 (3. 4), 设 X 满 秩 , 且 假定 4 成 立 , 则 
对 8 的 最 小 二 乘 估计 8 有 下 列 结论 : 
(1) Ep= 有 
(2) Cov(B8, 8) 一 o2 (和 入 ) 一: 
(3) EQK8) 一 (2 一 力 )a2 
- 证 明 :, 天 =ELCCXX)-IXY] 一 (XXX)- 
一 (X'X)-1X'XB8 一 有 
Cov( 有 ,有 一 Cov((X'X)-1X(CX8 十 e) ，(' 和) -1X7CXB8 十 e)) 
一 Cov(( 刁 ' 刁 ) 天 Xe，( 征 入) 于 ie ) 
一 ( 克 X)-X Cov(eye) 和 (和 辟 ) 一 


LU2 71-U WA\ 一 1 
一 和信 AL/ 


记 A=J 一 XCXX) -IIX , 由 (3. 10) 知 


:X 开 六 


局 (YY ) 一 CovC(Y,Y) 十 X88X 


一 72 [十 XB8X 


。 2Z00 。 





4AX 一 (J 一 XCX'X)-1X')X 一 0 
所 以 
EQ(8) 一 oztr(A) 
_ 2 ww 村 忆 厂 只 六 7 ArAAar、\ 一 1] < 1 
一 G TAI) 人 人 人 LT AAA 1/ 了 ) 
一 于 (7 一 trLCXXD) -XXX])》 
一 咕 (2 一 力 ) 证 毕 
ez an 2 尚 昌 在 人 四 尾 rr1 潍 第 的 冬 伯 下 最 小 一 和 还 仁 
大 二 天 记 vv 。 忆 WU AT AL 人 及 所 人 La 1 AN AT 9 妇 太 0 一 一 -人 
计 有 是 参数 8 的 无 偏 估 计 ,而 
< d 
是 ce 的 无 偏 估计 . 


行 X 不 满 秩 , 则 8 未 上 必 有 无 偏 佑 计 ， 请 看 下 例 ， 
例 3. 设 有 两 个 物体 分 别 重 包 2 , 应 2 未 对 ,把 它们 一 
放 在 天 平 的 一 端 称 次 ,第 ;次 结果 为 y%。 这 时 任何 一 个 稍 具 第 


-De 1 = A | 此 AL wm 上 庆 一 它 1 了 北 A 一 Fi 上 ~ 


识 的 人 都 知道 这 样 称 不 出 两 个 物体 各 自 的 重量 .从 数学 观点 来 
看 ,我 们 设 

入 王 世 十 房 十 EC 一 1 2 11) 
其 中 elyez，…，e, 独立 同和 (0,o) 分 布 ,cc 未知 . 这 里 和 矩阵 X 为 
2 X2 阵 ,两 列 的 元 素 都 是 1, 故 不 满 秩 . 凭 直观 我 们 知道 8 和 应 


革 H 尾 rr vv -~ -ARP AT、 还 可 严格 证 明 


POP rm nm -rt -- 瑟 
肯定 没有 无 癸 估 计 , 对 此 还 可 严格 证 明 . 用 反 证 法 ,如 采 所 有 无 
侦 佑 计 wp(y，y ，…y)， 即 


” 下 On 9 .yy2 9 ， yn ) 一 包 
[ 阿 


1 


PPp(Cyiyyz …， yn) 一 了 pp 十 应 十 el 0 十 序 十 ev) 


一 | way ”9 2 )(2Ta- ) 2e - 冯 2 吕 1 dz dz 


-~ 一己 咱 


-一 mm mA-- 门 ff WA 门 门 \\ 
HI HP 一 及 | \ HI19 127 


这 是 不 可 能 的 , 因 g(0)=g(0 十 0)=0=g(1 一 1) 王 1 不 可 能 成 立 . 
。206 。 





所 以 记 不 存在 无 候 佑 订 , 同 理 人 也 没有 无 偶 估计 。 

例 3.2 表 3.1 是 某 个 化 学 试验 中 ,每 隔 5 分 钟 对 温度 进行 
-六 测 县 鬼 钴 担 我 们 本 三 和 到 泪 诺 了 哇 时 有 本 化 的 邯 侍 为 了 简化 
二 -5 

计算 ,定义 
上 一 30 
密 ; -一 5 
y 一 (了 ;一 99.0)。10 


容易 看 出 ,数据 z 与 y 的 关系 不 是 线性 的 ,我 们 来 作 二 次 曲线 拟 
合 . 设 

y 思 一 4 十 pz 十 czi 十 e， 

表 3.1 试验 温度 数据 


时 间 上 分 ) 





经 过 计算 得 到 
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可 算出 残 差 平方 和 
Q 王 儿 7 一 X8 必 二 之 光一 2 一 2 一 CZy， 
一 1 188 一 13. 972 1X106 一 0. 181 8X20 十 0.433 6X688 


一 1.638 2 
随机 项 方差 估计 
一 Q/(11 一 3) 一 0. 204 8 
又 可 算出 
| 0. 207 5 0 一 0.011 66 ] 
(X X) -1 一 0 0.009 091 0 
| 一 0. 011 66 0 0.001 166 | 


所 以 Vara,Varpg,Varc 的 估计 分 别 为 0.004 25 ,0. 001 862,0. 000 238 8. 


Ar nrral ， 个 4 是 /TAN 一 人 
把 变量 二 和 4 用 原来 的 时 旧 | L 和 温度 二 代 和 蔡 ,得 经 验 公 式 


个 一 98.727 十 0. 107 71 一 0.001 734 祖 
为 了 找 出 最 高 温度 出 现 的 时 间 , 解 方程 


d 玉 ” 和 7 了 7 AAA AAA 人 rw 
一 -一 ULUI U。、UUD 和 DO -一同 
d 
得 上 一 31. 06( 分 ) 时 温度 最 高 
(三 ) 线性 可 估 性 
单个 8 可 能 没有 无 偏 估计 ,现在 研究 8 的 线性 函数 g(8) 一 c8 
何 冉 有 无 帆 估计 这 里 
c 一 (clcz…cp) 
为 数值 回 量 . 
3.2 称 c8 是 (线性 ) 可 估 的 , 若 存 在 Y 的 线性 顶 数 


a'Y= >,aiyi 使 得 
;二 1 


。 LO08 。 


FTV 一 ~ (VACRI 
yi 人 六 和 人 大 
加 和 则 VcER 有 
8 8 一己 太 /7 WA AN 一 1 WA 一 0 
LILCANWC LI/ < | / C 及 


即 这 时 cp 必 可 信 ,a 


下 和 ff 人 4 
况 下 Nv JJ ID IT 。 


定理 3.3 ”对 线性 模型 (3. 4), 设 假定 A 成 立 , 为 了 c"B 可 估 ， 
必须 上 且 只 须 "是 X 的 行 的 线性 组 合 , 即 <Ew(CX')， 
证 明 :充分 性 . 设 c =aXCaER"), 则 cp 一 aXB8, 从 而 
FEaoY=awEYy=cX8=c8 (VBER) 
因此 cp8 可 估 . - 
必要 性 . 设 c8 可 估 , 则 存在 “使 
FEa'Y 一 c8 (VB8ER2) 


R 
aX8=c8，VpERP 
(aX 一 c )p8 王 0， VPRER? 
上 1 一 
LU 
4 一 C 
即 < 是 X 的 行 的 线性 组 合 . 证 毕 


如 果 “8 可 估 , 则 它 的 无 偏 估 计 可 以 通过 6 的 最 小 二 乘 估计 
(一 定 存在 ) 来 构造 ， 
“定理 3. 4( 高 斯 -马尔 科 夫 ) 对 线性 模型 (3.4)， 


设 人 个 这 A 
ae NT LA Tv/ AAA LO Te -一 Y/ ks [AU 


立 ,8 是 6 的 最 小 二 乘 估计 ,那么 如 果 c8 线性 可 估 ,cp8 必 为 c8 的 
H 佳 一 … 


汪 


A 成 


由 条 量 小 方差 线性 无 依 佑 计 
中 贡 上 /人 全 汪 刀 珊 I。 


证 明 : 设 * 了 是 “8 的 一 一 个 无 偏 售 计 . 令 


ro C， G 一 4 一 4 


注 


| 网 到 
NU L 了 到 


weCX) ， 


人 | 


日 [] 
APF 


志 - 


ax YY 一 (a") 十 GY 
。 209 。 


三 闪 丰 性 天 人 全 
了 六 Y 为 c 8 的 任 一 无 偏 估计 ， 从 而 只 要 令 
六 一 Proj 5， 0 一 0 一 六 


Var(pY 一 CovCY YI)P 
NOD 工 CD UVANVE 9 /UL 
A 
一 (co1D)0 一 到 
2yrllrae ll2 | | 六 外 2、 
一 IO iT Ten 2 
一 T2(| 2， | 2 十 上 12) 
有 j ! 有 持 


即 (a ” ) 立 是 最 小 方差 线性 无 偏 估计 . 如 果 我 们 进一步 设 上 Y 也 
是 最 小 方差 的 , 即 
Var(pb YY) 一 Var((a ) 了 ) 
这 时 一 定 有 
人 时 =0， 一 0 
外 
0 一 0 一 0 0Y 一 (aa ) 世 
即 (a" )Y 是 cp 的 唯一 的 最 小 方差 线性 无 偏 估计 . 
最 后 来 证 (e* )"Y=c 信 ,这 里 6 是 8 的 任 一 个 最 小 二 乘 估计 . 


LA UL 4 j] 全 - 芝 亿 人 全 v 


由 定理 3.1 的 证 明 过 程 可 以 看 出 
。 27T0 。 


一 臧 9 一 rO] 
AL 你 ) 
因 au EAX) ,而 Y 一 LAwCX) ,所 以 
(wa* ) (了 一 Xp8) 一 0 
(py 一 (< 允 R 
A 忆 了 全 太 人 
又 由 
c =E(a) YY 一 (ae )X8， VPRER 
(a“ ) XXX 一 cc 
所 以 
(a* ) “ 立 一 (a* 7 有 一 ~ 
和 忆 如 忆 <、 六 人 
证 毕 . 
注 ”我 们 了 出 斌 不 用 线性 空间 的 抽 影 理论 直 按 利 田 本 陈 的 其 本 泛 管 给 由 
六 JS 由 JU JJ 17 一 性 一 一 下] 大 CO _ EL JI JAD AAAC 上 让 < 世人 ”人 了 7 一 中 


切 8 成 立 , 故 
Q 上 和 一 C 

根据 线性 方程 组 的 解 的 存在 定理 ,有 8* 满足 X'XB8' = X'a (因为 增 广 矩 
阵 的 秩 等 于 系数 矩阵 的 秩 ), 今 


4 一 人 8- 
则 Xia “一 Xa, 从 而 (ao ) (aa 一 o ) 王 (8 )X Ca 一 ) 一 0. 从 aa 一 a 十 
(ae 一 4a” ) 知 


NA 0 一 0 ) 





十 ae 一 a” 


ll: -le 
一 用 ae 由 十 ae 一 @ | 
我 们 指出 (a* )'"Y 也 是 < 8 的 无 偏 估计 ， 而 且 对 于 8 的 任 一 最 小 二 乘 佑 计 
请 均 有 (c 僻 一 (ao* )"Y. 实际 上 ,E(a'*)'Y 一 (a* )"X8 一 (8 ) /XXX8 一 (X'XB。)78 
一 (Xa) 8=aXp8 一 ca ) YY 一 (XP ) YY 一 (6 )XY 一 (8 )X Xp8( 因 为 有 
满足 正规 方程 (3. 6)), 故 (ao” ) YY 一 (ao  ) Xp8=aXp8=c8. 
态 一 方面 ， 
Var(ae YY) 一 a Covy(Y,Y)a 王 到 | 和 三 到 (Ce 有 十 一 ea 圭 ) 袜 
矿 用 一 Var(C(a Yar(e 且 7 








让 》 


芭 1 严 芝 


一 4* .由 此 知 cB8 是 cp 的 唯 


的 最 小 


长 _ 
汕 
性 
咎 
加 
到 
请 
类 
办 
计 
入 


方 关 线 性 无 偏 估计 
。 2 


人 
二 乘 估 计 . * 
/站 放 日 .全 性 大 弄 | 
CC 有 用 和 9 ?天虹 本 天 性 包 宇 人 


Q 《B3 7 
。 1 八 - 
所 有 < 8 的 无 偏 估计 (不 限于 线性 的 ) 中 方差 最 


eV 让 有 且 . 
鹅 凡生 


定理 3.$ 对 线性 模型 (3. 4) , 设 假定 A 成 立 , 和 矩阵 X 的 秩 为 
-~ ， 则 
<- 人 3 ) 
了 一 
12 六 


是 oz 的 无 偏 估计 . 
证 明 ; 设 和 ,总 ,…,8 是 wx) 的 一 组 标准 正 交 基 , 添 加 .61， 
6 名 使 之 成 为 民 " 的 标准 正 交 基 . 记 
VW 一 (6 1 


Vi 一 (6 6 6 4 可 
V 一 (Y 1 ,YY ，) 


又 了 可 用 Z 表示 ,得 








Y 一 VZ -一 (6， ， CE 9 ) 





从 而 
。2312 。 





所 以 


z 六] 
一 六 [vartz) 十 ( 瑟 ) | 
一 十 ] 
一 rw(7 一 广 ) 
证 毕 ， 
加 里 个 定 玉成 立 可 由 刘 一 毕 证明 ~ 且 2 的 县 小 方 关 三 | 
有 站 AT TEL AL < AL 9 -AL 4 和 了 UL JJ LA 人 一 L 亡 - Lt/J  AJ _LLTU 


估计 . 

(四 ) 审 约 束 的 线性 模型 的 参数 估计 

在 前 面 的 讨论 中 我 们 对 线性 模型 (3. 4) 中 的 参数 8 未 作 任何 
限制 ,因而 对 最 小 二 乘 佑 计 的 取 值 也 没有 限制 . 在 有 些 问题 里 , 参 
数 5 满足 一 些 给 定 的 条 件 ， 要 求 估计 量 也 满足 同样 的 条 件 ， 现在 就 
来 研究 这 个 问题 . 

例 3.3( 平 滑 问题 ) 在 天 文 测量 中 对 空间 中 3 个 点 构成 的 三 
角形 ABC 的 3 个 内 角 9. ,b ,0 进行 测量 ,得 到 的 观测 值 分 别 是 
J19.729?.y3。 由 于 测量 是 有 误差 的 ， 所 以 就 要 找 出 0 ,0 ,0 的 估计 
值 . 当然 mm ,yz ys 分 别 是 和 ,0 ,0 的 佑 计 , 但 由 于 凡 十 2 十 轴 王 
r, 而 yi 十 六 十 ys 不 一 定 为 x, 所 以 有 必要 找 更 好 的 估计 页 ,6 ,6 
使 0 十 0 十 b 一 T. 议 

太一 由 十 el 
yz 王妃 十 es 
3 一刀 十 ea 
。 273 。 


2 mA 们 假定 测量 3 站 1 wwA 忆 一 
各 次 测量 的 精度 相等 ,于 是 

下 e; 一 0， 卫 eie 一 CO 05 (7 一 
这 和 是 一 个 线性 模型 ,问题 是 如 何 找到 满足 条 件 6 ) 十 2 十 轴 一 x 的 估 
计量 有 


我 们 先 讲 一 般 理 论 ,然后 回 到 这 个 例子 . 
对 线性 模型 (3. 4) , 设 参 数 8 满足 约束 
万 8=ro 《3. 12) 
这 里 五 是 给 定 的 * 义 户 矩 阵 ,r 为 已 知 向 量 , 且 恒 假 定 方程 (3. 12) 
有 解 . 如 果 要 求 8 的 任何 估计 2 也 满足 
万 0 一 7 
那么 这 样 的 估计 问题 就 称 为 参数 带 ( 线 性 ) 约 东 的 估计 问题 . 
定义 3.4 记 
四 8, 一 (8: 万 8 一 ) (3. 13) 


(2) 7 一 XB 一 minly 一 Xp 
则 称 是 6 的 带 约束 条 件 (3. 12) 的 最 小 二 乘 估计 ,简称 约束 最 小 
二 乘 估 计 , 也 记 有 为 6r 

约束 最 小 二 乘 佑 计 永 远 存 在 , 有 两 种 方法 可 以 求 约束 最 小 二 


(1 ) ) 消去 多 余 参 数 法 


消去 多 余 参 数 法 的 思想 是 从 (3. 12) 中 解 出 多 余 参 数 ( 即 把 它 
们 用 无 约 东 的 参数 表示 出 来 ) 代 和 人 (3 4) 中 用 一 般 最 小 二 乘法 进行 
个 计 

不 失 一 般 性 ,我们 假设 矩阵 互 的 * 行 是 线性 无 关 的 (这 样 应 
有 < 户 , 否 则 参数 可 直接 由 (3. 12) 解 出 ) 且 头 * 列 也 是 线性 无 关 
的 





设 geE eu, , 则 
再 8 一 百 ; 8 十 再 ;2 二 六 
6 一 Hilro 一 再 TH; 82 


”人 2 人 


这 样 模型 (3. 4) 化 为 - 


r=x[| 上 + | 1 ee |+。 


少 


则 
艺 一 天 存 2 十 e 
现在 8 的 取 值 已 无 约束 ,可 由 正规 方程 8 


TY 一 X8|: 一 | 多 一 各 go | 
站 中 夺 亡 1 

匈 见 确 是 约束 最 小 二 乘 估 计 . 
消去 多 余人 参数 法 的 缺点 是 要 : 省 负 贮 有 时 Fr 罗 库 二 
明 信和 2 东 珍 认 人 人 昌 本 记 让 女 水 过 和 讶 FE 月 HL 从 。 


(2) 拉 格 明日 乘 子 法 


约束 最 小 二 乘 估 计 还 可 以 用 分 析 学 中 求 条 件 极 值 的 拉 格 朗 日 
乘 子 法 来 求 . 我 们 用 代数 方法 给 出 下 列 定 理 . 
< TB 又 CC 为 了 六 得 .给 枉 模型 4 的 此 久 南 尔 人 件 rQa 12 的 
人 LE j 士 ~ 。 休 上 征用 全 外 富有 市 了 不 床 TF 2 
最 小 二 乘 估 计 , 必 须 且 外 须 存 在 和 使 太 满足 
了 甩 7/ 开矿 方 TJ/、_ Ar/ 民 7 
必 必 人 IAA 一 个 工 
人 3. 1 有 
五 8 一 r。 


证 明 :充分 性 . 设 有 \) 炖 k3. 14) 厌 立 雪 为 任意 的 满足 万 8 一 mn 
的 向 量 . 则 
ly 一 Xel:=1y 一 XXX 及 本 

一 才 一 2 十 | 上 
寺 2(Y 一 X6)X (8 一 D) 
注意 到 8 和 8 部 满 生 约束 条 伯 和 而 媚 (8 一 6) 一 0, 又 利用 (3. 14) 
可 得 
(了 一 X6)/X 0 一 (X'Y 一 克 X) (8 一 有 ) 
二 一 人 万 (8 一 有 ) 一 0 


和 一 和 8 必 二 | 一 X8 本 二 8 一 D 下 
之 外 一 作 8 导 ” 
即 有 是 6 的 约束 最 小 二 乘 估计 共 
必要 性 . 设 8 是 满足 约束 条 件 (3.12) 7 的 月 的 最 小 一 乘 舍 


yz RD 114N\mAnNS 一 人 下. 工 H vt 毕 口 天 本科 上 明 汶 右 】 人 情 组 A 潍 只 
村 ?AD。 和/ DJ 宙 一 | 刀 人 和 任 届 上 秒 . 罗 开罗 和 区 月 人. 区 可 且 人 全 此 


(3. 14) 的 第 一 个 方程 . 


设 2 是 满足 方程 五 2=0 的 任 一 向 量 , 令 
8 王 5 十 地 
上 为 实数 , 则 
及 = 7 / 
1 太一 7 
由 约束 最 小 二 乘 定义 必 有 
| 一 Al2 yw 一 化 月 | 
1 个 六 1 -一 <* 六 | 


即 有 
"216 。 


外 六 一 和 8 一 于 和 了 | 
书 、 人 让 万 | 
| 
一 | XGO 一 8 用 十 2(7 一 Xp8) 人 (8 一 D) 
-21xzl2_ Or wwnN WP、~、 人 人 
Z 外 冬 刀 | LA 仆 1]/ .AAAO 一 


由 上 的 任意 性 及 二 次 函数 性 质 知 


7 Ar_ mA 人 
0 


(X' 了 一 XXXB) 全 一 0 
由 于 2 是 垂直 于 Aw( 互 )( 互 的 各 行 构成 的 线性 子 空间 ) 的 任意 向 
量 , 所 以 
/有 6 一 XYEACI) 
即 存 在 1 使 
X XB8 一 XY 一 百 、 


我 们 可 坟 指 出 ::: ， 7 
户 疡 一 二 下 过 NS YY 一 六 -上 _A 十 pr 一 一 TI 2 

(1 7) 约束 最 小 一 乘 全 计 永 远 存 了 仁和 作 仁和 、\ 疏 和 视 了 本 了 耻 自 从 
， 1 民 


或 俊 定 广 
(2) 对 于 带 约束 的 最 小 二 乘 估计 ,也 可 以 建立 相应 的 高 斯- 马 
尔 科 夫 定理 四 站 
例 3.3( 续 ) 因 只 有 3 个 参数 ， 我 们 可 用 消去 多 余 参 数 法 来 
找 出 0. ,0 ,0: 的 优良 估计 . 


一 yI， YZ 之 3 一 ya 一 形 




















则 有 
zl] 一 负 十 el 
z, 一 0 十 e， 
z3 车 一 由 二 和 十 e 
即 ， 
[1 0o1 人 e 
| 加 加 oo 针 
\ 3 人 二 四 【人 E3 | 
最 小 一 乘 估 计 为 ， 





。 2Z77 。 


一 襄 C 十 % 十 2 一 一 站) | 
1 
属 3 、 人 ”1 | .2 v3 | 
又 L | 
六 一 一 外 一 记 一 凡 一 于 (十 入 十 为 一 可 ) 
总 之 有 
站 一 一 于 ( 匀 十 加 十 国 一 站 一 1,2,3) 
龟 见 


FEO， 一 (0 


[ 


Var(0) 一 二 < 一 一 Var(y ) (一 1,2,3) 


这 表明 用 6. 估计 6, 比 用 单个 估计 秦 有 较 小 的 方差 ， 这 是 平 消 


这 个 向 题 如 果 用 拉 格 朗 日 乘 子 法 来 解 , 则 方程 可 以 写成 
1 一 4 一 ya 
凡 一 人 一 ys 
| 一 人 一 ys 
LO， 十 0， 十 C 一 开 


同样 也 可 解 出 罗 王 光 一 于 (十 yy 十 凡 一 T). 


(五 关于 最小 一 二 篆 估 计 的 讨论 


= 1 7 .YY 


作为 本 节 的 结尾 ,我 们 对 最 小 二 乘 佑 计 的 优 缺点 要 说 几 句 证， 


一 Xp 十 e 


的 未 知 参 数 8 进行 估计 时 ,广泛 使 用 最 小 二 乘 估计 . 当 X 满 秩 时 ， 
所 得 的 最 小 二 乘 估计 是 无 偏 的 而 且 是 所 有 线性 无 偏 估计 中 方差 最 


ne 一 LA An 的 站 -一 


小 的 ,计算 也 不 复杂 ,只 需 解 线性 方程 组 . 这 些 都 是 最 小 二 乘 估计 
:218 .。 


卫 v 优点 . 但 是 ,并 不 是 在 任何 情况 下 最 小 二 箭 估计 都 好 
， (1) 当 行 列 式 |XX | 接近 零 时 ,最 小 二 乘 优 计 妆 8 很 差 , 了 到 值 很 
AR 和 如 这 月 出 二 
zh 这 和 拒 ?了 这 生出 

Cov(8,) 一 (XX) 1 
if Zi | < Ar | + F 庆 和 由 二 YET rr WA 必 石 |、 产 作 Lp HH 证 人 
和 于 JJ| 人 人 | 入 过 伪 电 JIRULRJ、 到 人 有 JJ 他 > 人 | 人 和 LU 
出 现 这 种 情 次 ), 吏 得 考虑 其 他 的 估计 方法 .， 一 个 重要 的 估计 是 


5 一 (CX'X 十 AD-X' 

其 中 ) 是 正 参数 ( 当 ) 一 0 时 有 即 最 小 二 乘 估计 ) 这 种 估计 通称 崔 
估计 ， 是 由 Hoerl 和 Kennard 于 1970 年 提出 的 ， 关于 其 中 的 参数 
1 的 选取 现代 有 许多 研究 成 果 , 这 里 就 不 细 述 了 . 

(2) 最 小 二 乘 估 计 是 基于 最 小 化 残 差 平方 和 而 得 到 的 估计 
法 , 它 可 能 受到 个 别 数据 的 较 大 影响 . 换 句 话说 ,稳健 性 不 够 好 . 
30 多 年 来 ， 稳健 统计 的 思想 和 方法 得 到 了 很 大 发 展 . 比 最 小 二 乘 
佑 计 稳健 的 估计 有 最 小 一 乘 们 计 ， 它 的 定义 是 : 若 了 太一 (说 ， 
& ， 1 ) 使 得 、 


sn | 7 内 1 站 | | 站 | 
一 | yy \-i11i 了 Ti 工 十 之 ip7 


达到 最 小 ， 刚 称 8 是 858 的 最 小 一 乘 估计 . 求 最 小 一 乘 佑 计 要 用 到 
线性 规划 的 方法 ,其 统计 性 质 的 镀 究 也 比较 复杂 ,已 有 不 少 镀 冤 
成 果 . 


$ 4 线性 模型 的 假设 检验 


(一 ) 参数 线性 相关 性 的 检验 
给 定 线性 模型 
Y 一 XpTe (4. 1 ) 
其 中 X 是 已 知 的 2 X 户 矩阵 (>p) ,8 是 户 维 未 知 参 数 向 量 ,Y 是 


2 维 观 测 回 量 e 且 了 随机 项 .本 节 恒 假设 假定 吾 成 立 , 即 


《《 J1 JE 9? E 十 阴 已 -人 “了 于” 六 但 假 妈 假定 总 有 抱 立 , 印 


e 一 NO0, 玉 门 《4. 2) 
。 219 。 


以 下 以 > 表示 蕊 的 秩 ,表示 本 Y. 
.者 虑 检验 问题 
一 Ox4 > sn 1 .Y4.QN 
十 是 昌 “< 访 有 十 十 “< 伍 有 了 荆 和 月 天 
其 中 互 为 * 久 力矩 阵 . 
候 


W 一 (有 一 (=X8:8EReJCR。 f 

W。 一 (9 二 Xp: 一 0,6ER2C 了 1 

则 假设 五。 等 价 于 上 网。 衣 鸡 。 的 维 数 为 9 且 9g 和 < 
“我 们 用 广义 似 然 比 来 构造 检验 (4， 3) 的 检验 统计 量 . 记 


= (CE ) :6E 丽 ,之 0 
一 {(8o2)3:6E Wo2>0) 
易 侈 ,7 的 分 布 窗 讶 为 
pi6o0) 一 (2nop) texzp 人 一 2 一 后 | 
这 也 是 参数 (6,o ) 的 似 然 函 数 . 不 难看 出 ,要 使 这 个 盟 数 达到 最 大 


人 全 V 人 ii 口 a 《< el2 旦 ， 2 人 全- 二 \ 上下、 上 且 - 二 
值 ,从 有 顷 且 只 顷 选 必 由 工 | 最 小 ， 赎 选 z 人 AKC JJ JJ、 寺 JJH 八 
值 . 记 
eE 王 Proj 了 了 ,， 乌 一 ProjY 1 
W。 
可 全 1 同和 
易 知 (7 了 ,6, 呈 ) 在 上 和 于 一 一 7 一 入 时 达到 最 大 值 sup 加 (Y， 
7 (te,o2)EB 
2 
ea) ,在 一 名 oa = 二 7 一 6 | 时 达到 最 六 值 sup 妃 ( 了 ， &,a2 ). 


(6,a “)Ee 


于 是 广义 似 然 比 
supP 妨 人“ ， 6ia ) 
0 


有 开 


上 Y 一 名 | 2 
[7 一 络 lj 
注意 到 YY 一 上 丸 , 而 和 一 名 E 砚 , 故 了 一 和 LE 一 名 ， 从 而 有 
。 2Z200 。 


on 0 
所 以 
3 
1 一 | 1 十 - 
II<r 和 1 2 
外 一 嫩 ll 
上 一 所 站 
> 全 一 一 
一 | 


一 时 /Cr 一 9) 
1 一 省 /一 7 
对 否定 域 (A 盖 io} 必 有 C 使 { 开 >C) 王 (和 > ). 因此 下 可 用 作 检 验 
统计 量 . 下 面 的 定理 给 出 了 和 零 假 设 下 下 的 分 布 ， 


Ia Ta 人 人 AL ia 了 II 14 JI iT 一 《63 、 T 了 
人 上 上 FE 气 。 上 对 线性 和 覃 型 (4. 1)， 芭 (4， 2) 成 立 , 则 在 假 《0 


时 ,统计 量 下 的 分 布 为 上 (7r 一 9 7 一 广 ). 


吕 


员 
尘 














证 明 : 在 R* 中 取 标准 正 交 基 提 ,名 ,…，,55( 均 为 列 向 量 ) 使 得 
5 52 A- 体 。 的 基 ,6 62 5 55 为 他 的 基 . 记 
V 一 (名 6 ， 1 ) 
下 矿 ” 一 Am Lu 如 只 
YY 1” 人 19S2? ?Gd 7/ 
V : 一 (6E+i ,二 2 9 E ) 
V 一 (V ，V) 
令 
f > 
心 1 
_ 之 2 加 
Z= 王 | .|=V7 
人 win | 


则 


”20 。 


又 由 2Z=VY 得 


其 中 六 V 一 了 而 


(因为 在 五 。 下 应 有 5E 克 。, 而 V; 的 各 列 垂直 于 凡 。)， 


于 是 有 
人 上- 器 


这 1 站 明 ~ 


We 之 ] 


所 以 在 万 。 下 有 


且 二 者 独立 . 故 在 瑟 。 下 


。 Z0L 。 





VZ” V” < 
vs-(wjs te 
网 大 6 


上 服从 上 (7 一 9，7 一 r) 分 布 . 


证 


毕 . 


的 一 个 最 小 荆 乘 估计 , 为 8 在 约束 条 件 五 6 和 0 下 的 一 个 最 小 二 乘 估计 ,只 
村 用 X8 和 Xp 分别 代替 上 文 的 上 6 和 .名 ,不 难 验证 上 述 推导 仍然 成 立 . 这 时 
1z 一 省 := 站 7 一 Xp|: 是 残 差 平方 和 Qi |Y 一 6 村 一 和 一 Xpo 业 是 约束 条 
件 HE8 一 0 下 的 残 差 平方 和 , 常 记 为 Qnr 于 是 外 一 5 一 Q QQ, 下 一 


QQ 一 虽 ， 这 是 常用 的 公式 ， 
用 8 表示 6 的 最 小 二 乘 估计 , 则 6Xp8( 见 定理 3. 1 的 证 


阳 、 今 ， 


注 “” 我 们 可 以 不 使 用 线性 空间 的 投影 理论 ,直接 表述 统计 


地 
二 
并 


e 一 了 一 上 -了 一 XB 
称 e 为 残 差 , 记 
1 
Q 一 |e 半 == > 中 一 (Zip 十 zs 记 十 … 十 六 3 


它 是 残 差 平方 和 ,X 和 Q 之 间 有 如 下 关系 : 
系 4.1 对 模型 (4. 1) , 设 条 件 (4. 2) 成 立 ,8 为 6 的 最 小 二 乘 
估计 , 则 X8 与 残 差 e 独立 ,从 而 Xp8 与 残 差 平方 和 Q 独立 , 且 
Q/ 叶 一 X Cn 一 站 ) 
证 明 :不 论 假 设 瓦 , 是 否 成 立 , 在 定理 4.1 证 明 中 总 有 2Z 一 
NICVE,c 门 ,从 而 独立 性 得 证 . 又 EE 厂 ，, 故 5 与 上，6H2， 6 
正 交 ,因此 











1 [6 
| e， &A 
| 国 
Sr+1 | 
人 辣 j 人 LO 
JE FI Ar AAA 工 上 日 天 rrAn 
衣 ZI1y Zr+ 2 种 开 同 N 人 00 分 仙 ， 才 征用 州 
， 1 sn ， 
， CQ/ 人 /co 一 二》2i 人 XGOa 一 三 ) 
1 5 ;= 二 1 


土 面 证 明了 .Xp8 与 Q 独立 ， 下 面 
的 讨论 中 将 可 以 看 到 , 当 X 满 秩 时 ,8 与 Q 独立 . 对 的 可 估 玫 
vVv7J7L T 1TJ 4 月 二 J” 人 19 JJ CE AR .人 有 有 3 4、 HH 一 1- 
组 合 有 如 下 的 一 般 结论 


< TB AL 证 才 Srv TAN AAA 2 成立 7 
信和 王 和 ol 半 羽 和 宇 \ 生 上 /以 宋 1 二 .CC7] 有 ALC 有 


性 组 合 ,6 是 6 的 最 小 二 乘 估计 ,Q 为 残 差 平 方 和 , 则 :与 Q 相互 


在 尺 " 中 取 标 准 正 交 基 6 名 6 使 得 和 ,名 ,6 构成 w(X) 的 
基 , 记 
一 (6 ,ER V 一 (人 El 名) 


V 一 (Vi V，) 站 
今 :1 YY 
7 王 克 习 三 
心 一 Y 
则 
ZF 一 NICVXB85o2D) 


故 之 1] 9 之 2 9 ”” ”9 之 7 相互 独立 ,又 
c=(a 7Y=(a)VZ=(a ) wy V)Z 


| (4. 4) 


而 残 差 = 一 2 <6Q 一 12 本 一 2 ,所 以 c 依 与 Q 相互 独立 


3 
AL 全。 


系 4.2 在 定理 4. 2 条 件 下 ,如 果 和 满 秩 , 则 请 与 Q 独立 , 且 
有 一 N(C8,o2CXX) -1D)， Q/ 人 /一 X (Ca 一 力 ) 
前 一 节 我 们 已 经 说 过 w 兴 相 四人帮 音 人 10 都 是 可 人 


可 


| 
CD 


9 
个 
JUL 


的 . 从 (4. 4) 知 有 只 与 心 1 9 ”””9 之 r 有 关 , 而 Q 只 依赖 于 zi ，…，zv， 
。 LT 。 


1 仁 ; 
昌 有 了 红 志 了 ?了 隐 疏 大 证 过 有 (CC 有 有 hb 上 1 


SN 
七 


让 
定义 4.1 设 cy 是 c'p. 的 无 偏 估计 且 aEw(X), 则 称 a 为 < 
的 伴随 元 
从 定理 3.4 的 证 明 过 程 可 知 , 若 c8 可 估 , 则 ec 的 伴随 元 存在 
唯一 , 当 尺 满 秩 时 ，c 的 伴随 元 为 ， 1 
a 一 X(XX)-lc 


(这 时 用 c 6=c (CCXX)-XY=aY 来 估计 c2)，. 





< 2 外 性 烧 刑 r1 1、 沿 息 件 r1 0 由 羡 并 了 殉 vao 斌 
本 人 一 LE、 站 1、 工人 /一 7] 
c (6 一 有 ) 
< 从 丰 7 一 广 ) 
ra 
其 中 a 为 c 的 伴随 元 ,rr 为 其 的 秩 ,a 一 / & 。 
入 7 一 六 
: 证明: 由 定理 3.4 的 证 明 过 程 可 知 cj 一 ca 立 ,于 是 ， 


Var(cp) 王 Var(aY) 一 a Cov(Y,Y)a 
一 ac 
改 
-8 NCcB，ozlal2) 
又 由 定理 汪 2 知 及 与 Q: 独 立 , 又 
Q/ 叶 ~ C2 一 六 





十 | -+ < 
故 
cB 一 c8 | 
| c 一 帮 了 2 一 广 ) 
上 1 7 一 
1<1 
即 
(月 
> 僵直 7 一 广 ) 
cjaj 


。 L0D 。 


证 毕 . 


则 可 用 统计 量 
< 太一 mm 
xl cj 
在 克 , 下 ~-t nz 一 r)(r 为 X 的 秩 ), 取 、 共 得 
王 (| 引 盖 | 万) 一 o 


天 堆 检 的 不 恰 汪 | 了 
】 4 是 口 人 -ACE 一 人 1) 


Ho:c 6 委 m ,Hecp8>m 等 假设 也 可 类 似 地 使 用 上 统计 量 进 


(a 为 c 的 伴随 元 ) 


aw 虽 





行 检 验 . 
(2) 丰 c8 可 舍 , 我 们 可 以 求 出 c8 的 置信 区 间 . 因 
3 
2 < 


到 1 使 PC|i| > 一 e, 则 c 的 1 一 "置信 水 平 的 置信 区 间 为 
[cp 一 ialcc8+alalca 


例 4.1 我 们 来 检验 一 下 例 2. 2 中 模型 的 相关 性 .这 里 


ur 


X 一 (22,68,108，…,1 100) 
Y 王 (0.75,2.4,322，…，38.0) 
XXX 一 2685 141， YY=3 376.312 5 
最 小 二 乘 估 计 p8= 互 =0.035 44, 来 检验 
刀 ,:; 一 0 








即 取 c< 王 1 ,检验 ,:c 8gB=0(8 三 万 ).， 易 见 c 王 1 的 伴随 元 为 a== 
XCXX) al=vXX, 取 统计 量 
_6- 
和 
| 
在 万 , 下 ~-…t1I1-1)， 计 算得 
“2 ] Ahll2 
闻 = 一 二 人 7 一 欢 | 
1 “ 甩 太 所 万 志 r 已 关 了 了 了 2、 
一 10CYY X7“X 万 2) 
一 0. 379 26 
0 一 0.615 8 
上 一 904. 31 
查 得 410) 分 布 的 1 一 0. 005 分 位 点 才 为 3. 可 见 应 拒绝 瓦 ,. 


星团 距离 与 速度 之 间 确 有 线性 相关 关系 . 
用 上 面 的 c,|cl 还 可 算出 五 的 99%% 置 信 水 平 的 置信 区 间 为 


-” 廊 | 一 ~ 0012 . 即 瓦 人 Fo 03425.0 


| VOL Cg EN LV II Ce 


Is 


和 参 IT 1 /AN 十 性 
中 上 站 妨 
我 们 本 节 利 用 8 3、8 4 中 建立 的 线性 模型 的 一 般 理论 来 研究 
$ 1 中 提出 的 回归 分 析 问 题 . 我 们 的 出 发 点 是 因 变量 y 与 自 变量 
必 19\ 亿 2 ， 9》\ 忆 旋 下列 数 据 
il Zi ”ip yi 
， 21 民 22 之 2 六 .2 国生 
(5.1) 
. 夺 ，1 大 9 .万 站 放 VDn 
需要 解决 以 下 问题 
(1] ) 有 与 Z: 9 . 忆 2 》 9 - 志 访 是 否 有 下 列 线 性 关系 : 
y 一 Ar 十 记 l 十 记 zz 十 … 十 Do， 十 e (D.2) 


。 Z07 。 


2) 右 y 与 习 ,z，…zs 有 (5.2) 的 关系 ,如 何 找 出 凡 ,8 


上 《> 人 十 三 
的 估计 值 六 ,8 0 1 


(3) 如 何 利用 回归 方程 
y 一 序 十 Bi zi 十 Br 十 … 十 pz， (5. 3) 
进行 预测 和 控制 . 
我 们 先 回答 问题 (2) (3) ,再 来 研究 (1)， 
(一 ) 回归 参数 估计 
我 们 用 3 中 介绍 的 最 小 二 乘法 来 估计 回归 参数 ， 记 




















其 中 
1 
昌国 的 
上 了 一 。 9 CC 一 (Zi ) xn 
1 
二 /nxl 
并 记 
A 61 y1 
al | 
| 
VOD。 / VE， / yn/ 
则 由 (5.1) 和 (5.27 有 
Y 一 XpTe 45. 4) 
在 回归 分 析 中 ,我们 恒 假 定数 据 (5.1) 使 X 的 各 列 线性 无 关 ， 
即 X 的 秩 为 上 十 1. 由 3 知 8 的 最 小 二 乘 估计 为 
有 一 (XXD) 1 X YY (5. 5) 
我 们 要 找 一 个 更 便于 计算 的 公式 . 记 一 


一 扫 ( 工 4 一 式 .;) (Zi 一 元 )) 
& 一 1 


。 2L。 


2，y17 一 1] ,2 ， 力 


一 > (Cs 一 TI 一 y)， 7 一 1 人力 
一 NT， 一; 
EL 7 


人 一 《Li 7 pxp， 人 一 《Li 0) pxl 
上 


叶 。p 


8 有 


RN| 


其 中 


人 -一 一 性 Z 一 1 2， 亡 
-1TKA 
.JJ 一 一 之 /yy 
这 里 工 叫 做 相关 矩阵, 易 见 
L;， -一 > 一 71T .iT 


wy 1 C\V /7 17 元 
“ACE CC 人 WE 工 十 xz 二 到 





必 一 ] 
忆 六 72 了 
二 crj= 人 
用 和 扼 阵 四 块 求 送 公式 可 得 
工 十 元 ZL 元 一 元 Lan 
(XXX) -一 | 7 
[一 工 1 云 L- | 


从 而 


。 ZL 。 














~ 人 六 一 元 工 辣 工 ，] 
5 = (XIX)-XY 一 | 
Lo | 
所 以 0 ) 矶 ， /77 的 最 小 二 乘 估 计 为 
记 
0 一 y 一 .7 记 工 2 
i 一 1 
fp fy ] 
/ 
号 一 工 -| | 一 二 LDL (5. 6) 
局 | 
残 差 平方 和 
Q= 7 一 项 | = YY 一 YX 
[yy 十 ?By 人 四 有 
\ 了 - ,十 7y 生 人 7/ 
一 一 工 : 了 
记 
一 > 010 (5.7) 
j 二 1 
误 关 标 准 差 估计 为 


一 六 一 


0 一 /55 一 1 (5. 8) 
由 定理 3. 2, 如 果 设 (5.4) 中 的 随机 项 e 满足 
Fe 王 0， Eee 一 co 
则 最 小 二 乘 估计 是 无 俩 估计 , 且 
Cov(8,8) 一 吐 (XXD) 一: 
， 二 十 元 工 - 元 一 元 ! 
一 G 11 (5. 9) 
LU 一 民 L 


中 中 交 一 组 白 灾 量 值 人 一 低 4 ,六 一 六 9 se 7 一 六 5 本 得 预测 什 
AAA LEL 1 -六 二 TIL ] 上 9、 必 < 2 9》 > - 仿 旋 >3 JI JJ 入 1 六 JEL 
y 一 序 十 房 双 十 … 十 Boz9 

如 革 
AALAy ~ 
一 康 十 刀 十 十 pz 一 
日 ~ 目 . 廿 诅 侍 所 一 JR 0 .LO 0 II 王 - 
PR y 和 证 让 至 卓志 了 0 上 上 且 1 之 1 三 记 pw 之 p 的 无 偏 佑 ?* 计 . 
下 面 来 找 忆 y 的 置信 区 间 . 设 (5. 2) 中 随机 项 'e 一 NO0,c)， 
则 令 


/ 
C 一 (! , 并] 9 ,并 ) 


忆 y 一 cp8 
是 一 个 线性 可 估量 ( 仍 假设 (5. 4) 中 的 X 满 秩 ) ,由 定理 4. 3 的 系 
可 知 


ee 


上 及 ( 于 1 和 人 一 
了 工 


了 VCTCZXJ-TIC 


AZ 


记 
0 一 YY -0 -0 。。 -0N/ 
必 \-L1 9.2 9》 9 力 / 
册 | 
cC (XXX) ec 一 二 十 (到 一 起 工 (7 一 元 ) 
因 


入 天 六 广 
， d  ( 十 Bizi 十 十 Port) 一 cB 
和 ~ 人 ”上 AAA1 一 


三 ” 
G 记 十 (Z 一 元 ) 工 (一 元 ) 


查 上 分 布 表 知 有 A 满足 王 (|ij| 之 1) 一. 





、 刁 
7L_ 
。 & 一 一 MOA 一 十 (ze 一 元 ) 工 -1(Zo 一 ) 
则 已 y 一 cp 一 训 十 8 也 十 … 十 pz 的 1 一 置信 区 间 为 ， 
ff P-L Lp 0， np_A 7 十 .十 PP 0 站]. 
LA20 十 记 1] .人 L1 1 1 人 pb 他 /0 十 < | | 万 p 十 力 | & | 


下 面 我 们 来 求 真 值 > 的 置信 区 间 . > 的 预测 值 为 : ， 
。 231 。 


所 一 一 十 A r0-。。 二 Dr 一 8. 
7 AU 和 产 1 一 上 PPp 一 记 4 及 
钠 调 族 老 
AN 一 ”一 ”0 
JJ .yy ~“ 六 
A 7 六 
一 (y 一 C1) 一 c (00 一 人) 
三 I 有 旦 大 了 EN -一 0 ,一 0 6 从 立 F AD YI 
人 全 已、 芭 |j yy 是 黎 型 人 《5:4) 在 并 一 1， bp 一) 多 一 人 本 AU 认 | 


值 , 所 以 我 们 仍 假 定 对 应 生机 


= 人 








pozz 一 y 一 c 0 
,ee 独立 日 有 相同 的 方 (C0,o) 分 


布 ,这样 就 有 
Var(6) 一 o 十 ozc (XXX) 一 lc 
人 十 


| 
记 
S 





5 一 NI0 0 E 


十 (z2 一 五 仑 -1(z? 一 瑟 ) | 


一 帮 7 一 力 一 1) 《5. |) 





oo 一 好 /1 二 元 十 (za 一元) 人 -Kxzo 一 元 ) 


则 真 值 >= 十 B 巧 十 … 十 Br 十 eo 的 1 一 c 置信 区 间 为 
[Lp 十 记 双 十 …… 十 pz 一 0 十 记 世 十 …… 十 Boz2 十 了 

它 比 下 y 的 置信 区 间 要 大 ,因为 ， 比 已 多 了 一 个 随机 项 e， 

应 该 注意 的 是 (5. 11) 成 立 的 条 件 是 (zi,，…，,zs,y) 符 合 原 来 
回归 模型 ,这 要 求 观测 (zo ,…. 小 时 变量 之 间 的 关系 没有 大 
并 人 /一 观测 (zi， ,2Zp yy) 旧 站 这。 寺 下 一 AN LS 了 呵 
的 改变 .因此 (5. 117> 的 上 统计 量 可 以 用 来 检验 假设 

TJ  r4B 屿 TAOrTar -0 。。。 ~0 \ E 上 :7Z 寺 TI 一 IE FF FE 沙 [ 

4z0 3 7] 二 4 JJ 双 ALD、-1 9? , Zp yy 一 相关 六 1 /站 / 门 J 基态 


据 来 自 同一 线性 回归 模型 ， 名 


当 上 的 绝对 值 大 于 某 个 临界 值 时 拒绝 吾 。, 即 观测 (z，…,zgyy) 下 

一 。、 喇 AAA ee Fe -A E 旦 一 < AZ 到 有 芝 了 丈 有 ”7 二 

慨 量 上 的 关系 已 有 性 化 . 
全. 扩 人 志 S 1 :二 F 和 1 全 的 右 朱 国治 在 锥 片 在 2 yi 洲 『r 上 0 
芭 ”JJ 沁 。 上 人 SC ve 工 AFL 六 六 及-JARTN- 大 一 LAN DJ 





我 们 对 车 祸 数 (?y) 和 汽车 数 (z) 来 拟 合 线性 回归 式 , 计算 得 : 
2? 一 11， 2 一 5711， 忆 一 2 396 
2 一 3134543， Zrziyi 一 1296836， 之 % 一 539 512 
求 得 回归 方程 
y 一 55. 86 十 0.312 0z 
相应 的 上 统计 量 
F 一 132.0 
自由 度 (1,9) 的 下 分 布 的 0. 99 分 位 点 为 .10. 56, 可见 回归 方程 是 
显著 的 
表 5.1 ”有关 英国 车 祸 次 数 与 有 执照 汽车 数 的 数据 

年 份 。 ， | 车祸 次 数 % 千 次 ) | 有 执照 汽车 数 z( 万 辆 ) 

1948 ws 153 373. 

1949 177 41】 

1950 201] 441 

1951 210 462 

1952 208 490 

1953 227 529 

1954 238 577 

1955 268 641 

1950 268 092 


AI 4 
民 


”下面 我 们 用 得 到 的 回 妇 式 进行 预测 .应 当 强 贡 指 出 的 是 ,在 


实际 工作 中 ,不 能 仅仅 根据 统计 关系 做 简单 的 外 推 ,因为 得 出 已 知 
大 一 一 2 Lv LIU AAA、 了 和 上 7 AT 
统计 关系 的 实际 背景 可 能 有 变化 . 在 这 个 问题 中 ,必须 对 与 发 生 
车 祸 有 关 的 因素 进行 详细 的 研究 LE 力 虽 和 八路 和 交通 目的 兴 民 站 
下 于 有 信 有 人 上 1 JP- 丽 JUAL9 LEAN CE 信德 才 、 
况 ， 宁 增加 的 汽车 的 种 类 和 人 性 能 以 及 人 们 如 何 使 用 这 些 汽车 等 


rr 二 -人 关口 -二 人、 大 六 所 人 六 和 站 ve -~ APee 《Ice  ， 


等 ， 这 些 与 车 视 有 关 的 复 屯 因 系 是 否 仪 和 人 八 昌 之 必 ， 
相对 于 有 1 000 万 辆 汽车 , 即 盖 王 1000, 可 得 预测 值 
y 王 367. 85 
即 可 能 发 生 大 约 367 850 次 车 祸 ， 易 见 这 时 (5 .11) 的 上 统计 量 可 


以 写成 


1 一 JJ 
5V1T 寺 十 (z 一 立 ) /La 
M  ， 
由 由 可 得 在 识 尖 上 网 Go 定 济 区 癌 汶 
TH JU JJ 于 7 太一 人 


即 328 227 次 到 407 473 克之 加 


假设 在 下 一 年 内 ,交通 管理 部 门 对 违章 驾驶 进行 了 更 严厉 的 
处 罚 ,汽车 数 是 800 万 辆 ,发生 了 270 千 次 车 祸 ， 我们 想 知 道 汽 车 


数 寺 丰 祸 数 之 间 的 关系 是 否 发 生 了 显 着 的 变化 . 设 





一 800， y 一 270 
可 以 算出 
305. 45 
及 工 统计 量 值 
上 一 一 一 -一 一 -一 = 一 2.54 

5 /1 十 二 十 (zo 一 元 )271 

人 72 
活 上 韦 个 认 
“了 He 1 LA 2L 


HE :车 祸 数 与 汽车 数 关系 不 变 


TT … 让 3 品 玉生 YE 中 / 八 一 
<Ll 3 一 广 多 名 和 TO -人 了 


可 以 用 单 侧 否定 域 {t<< aoj ,9 个 自由 度 的 上 分 布 的 0. 05 分 位 数 为 
。234 。 


控制 问题 是 要 求 因 变 量 y 以 1 一 c 的 概率 取 值 于 区 间 LA,BJ， 


站 


变量 zi ,zy ,…: ,1 应 控制 在 什么 范围 内 内 . 这 是 预测 问题 的 反 


查 上 分布 表 得 ”一 如 一 1 自由 度 时 1 一 了 分 位 数 ( 即 双 侧 x 水平 


分 位 点 )M, 则 下 列 不 等 式 以 概率 1 一 ac 成立: 
(一 一 Bi zi 本 机 一 Bo)? 


/ 一 /一 一 一 、/ 
T 一 (ZI1yTZ2，… py) 》 工 一 (1 并 .9 工 .p) 


根据 要 求 4 和 过 yy 委 B ,从 上 述 不 等 式 就 可 以 找 出 之 1 9 过 2 9 "9 尼 力 的 控 


| 


由 yy 吧 ， 


例 .2 低 销 定 膨胀 合金 由 铁 . 钊 、 销 、 铀 组成. 在 控制 琳 质 含 


量 及 一 和 定 的 工艺 条 件 下 ,其 膨胀 特性 被 合金 成 分 所 确定 . 我 国 某 
课题 组 (1975 年 ) 的 研究 任务 就 是 :确定 合适 的 合金 成 分 ,使 得 销 
的 用 量 尽量 少 , 但 使 得 合金 的 膨胀 系数 与 次 封 材料 的 膨胀 系数 相 


司 、4 许  ，"， 5 一 9. 0 之 间 ,单位 : 1IU 7/ ) 


这 了 就 是 一 个 控制 问题 ， 首先 要 建立 回归 关系 式 . 设 铜 的 百 分 含 


量 为 , 旬 的 百 分 售 量 减 去 30 后 记 为 zz，, 甸 的 百 分 会 量 为 zs, 记 


轨 300 必 1 600 和 时 全 全 的 脱 脱 和 有 委 迎 .它们 起 有 且 > 
Q300 ?CQ500 妇 人 一 光电 亚 胸 甩 上 敢 示 然 ， 已 亿 Rbh 古 并， 并 2 -3 


的 函数 ,考虑 到 各 种 误差 因素 , 设 


CX300  ” J1IN\1 "过 2 9? 之 37/ El 


CQ500 一 矿 (1 .万 2 9 之 3 ) 十 s， 


性 愉 能 根据 试验 数据 去 稀 定 广 - 和 太 ,也 就 是 建立 经 验 公 式 . 因 为 线 
性 上 项 数 明 显 不 符合 要 求 , 所 以 设想 用 三 元 二 次 多 项 式 模型 


。 230 。 


天 


mo 


AAA 


过 1 9》 们 2 ,3 ) 一 Co 十 2 Zi 十 2 
1 十 Di 代 ， 十 Di 十 
pz2 十 bszzas 十 pos 


一 人 一 年 ee 全 生生 Ne 


为 了 确定 系数 bo ,加 ，…， 庆 , 该 课题 组 炼 了 2 kg 钢锭 60 炉 , 其 名 义 
成 分 如 下 : 


铜 / 2 0. 5 1. 5 3 5 7 

镍 /%% 32 34 35.5 37 

钼 /2 4 6 8 
全 部 组 合 为 5X4X3= 王 60 种 . 各 炉 的 实际 成 分 及 膨胀 系数 见 
去 5 2 


-了 ve 





位 300 位 500 


(10-5) 






1 32. 10. 44 

2 | 0%50 | 3l66 | 5.38 | 412 | 9.23 

3 0.51 | 31.64 7. 26- 3.02 8. 25 

58 8. 32 36. 80 3. 59 7. 49 9.11 

59 8. 10 36. 39 5.02 7. 93 8.84 
6 : 





可 以 计算 出 caoo 的 回归 残 差 平 方 和 Q=12. 12,o 王 0. 49;asoo 的 回归 
。 230 。 


残 差 平方 和 Q=1.46,o 三 0.17;, 这 商 个 回归 方程 都 是 显著 
二 < 忆 /JJ “FE AL 艺 己 - 仁 


用 来 进行 控制 . 问题 为 要 求 
5. 5 和 asoo 委 8.0 


5， 5 入 -ason < 8. 0 


一 二- 自 PP 全 -aas 生 


问 zk,zzyzs 应 在 什么 范围 (这 个 范围 称 为 瓷 封 区 )? 
从 理论 上 看 ,这 个 范围 是 由 几 个 二 次 曲面 围 成 的 ,但 由 于 曲面 


/一 上 LA 一 一 一 EN RU HU FI AR >” 一 II JJ HU 


较 难 研究 , 故 从 实用 角度 看 可 利用 切片 法 ( 即 固 定 一 个 目 和 


容 另 两 个 自 恋 量 之 间 的 曲线 关系 ) 找 出 姿 封 区 的 一 个 典型 部 分 虹 
稚 力 陪 人 有 福娃 一 司 反 国有 鸡 天 东 1J 忆 芭 必用 广 呈 Rhb 人 个 呈 


可 . 根据 以 往 的 经 验 和 节省 销 的 原则 ,选择 销 在 55 到 5 之 间 ， ， 


固定 销 人 含量 5% 、5.5% .6% ,分 别 找 出 铜 与 镍 的 关系 ,最 后 得 到 
铬 、. 铜 、 镍 应 控制 在 下 列 范围 内 ， 


人 2 


5% 委 销 和 6%， 3;:5 上 < 雯 铜 生 4. 50 
全 %% 福 钢 - 儿 十 销 S46. 5 加 


生 
从 
Dh> 
缚 
全 
了 
忆 
有 
= 
晤 


( ID、 ID JE 和 ch Ardes :局 ATA 
\ 呈 / 回归 模型 中 的 假设 检验 


现在 来 研究 本 节 开 头 提 出 的 问题 (1), 即 如 何 根据 数据 (5 


判断 (5. 2) 中 随机 项 e 六 娄 够 下 全 得 应 建立 的 回归 方 程 ( 3 
是 有 意义 的 . 这 就 是 要 检验 下 列 假设 
1 : :8 元 应 一 … 二 及 一 0 (5.12) 
FLATK 1DNV3bhHFApA BR 关 、1 FFEZ 寺 一 由 II 一 AKC ON 上 -万 
LE ANVwVe 书 ) 被 拒绝, 我们 避 认 为 所 建立 的 图 归 方 程 (5. /全 月 
意义 的 或 者 说 方程 (5.3) 是 显著 的 . 这 时 就 可 利用 (5. 3) 进 行 预测 
或 控制 . 


有 时 还 要 判别 革 个 有 目 变 量 或 某 些 自 恋 量 对 > 是否 有 显 苇 影 


< 叫 


啊 ,这 个 化 为 检验 某 个 或 某 些 回归 系数 为 零 . 即 检验 下 列 假设 


万 ”0 < 玉 一 。ees 一 及 -一 人 f 1 有 1 
是 0 /2 人 io /5 7 Ne 工 届 /7 


(这 里 > 是 固定 的 ,1 <5 委 站 ,1 入 2 忆 . …<<i, 妇 了 尹 )， 


了 芭 于 Al AAA Fw 

rr 困 FT 有 目 -wrA NE 了 昨 么 和 证 引 性 天 蒜 
也 士 太 让 3 人 入 \ 人 PTLI/ 甩 了 陡 ? 全 1 人 5 残 性 抱 大 

我 们 先 对 假设 (5.14) 给 出 检验 方法 ,然后 分 别 用 到 假设 
AP 站 NTrA7F 站 人 一 一 
《D.。L2)THAD. Lo) 三 去 ， 

我 们 在 “假定 B2” 下 进行 讨论 , 即 我 们 假定 

一 所 十 8 十 … 十 Bize 十 el (一 1 7 《5.19) 

共 中 相 五 独立 同人 分 布 . 兹 同人 分 布 且 NO 2 rr 未知 ) 
AR | 9 < 下 器 一 RN 9 AAA TI CI ACE 上 ANY 9 IANANL As AR 7 


， 儿 用 前 面 的 记 导 . 如 和 =( 正 ,C)，. 








ae 一 Prniww ea 一 Prrniww 
仿 了 荆 \ 荆 9 0 攻 下】 挟 
克 W。 
轴 dd c3 和 4 1 如 纺 计 县 ， 
六 HU AL 工 。 1 工 AN 鳃 、 
人 一 名 时 /2 十 1 一 9) 
下 一 一 一 一 一 - (5. 10) 
一 人 人 人 2 一 记 一 上 上 ) 
在 万 。 下 服从 FIA 十 1 一 ”和 一 一 1 有 二 mn 贡 T 的 维和 尖 
攻 是 DAAN\PTL CUI1 PP LI 万 4 二 Td 让 0 让 妈 人 ? 
易 见 9 一 力 十 1 一 5S， 万 下 
人 全 全 il2> / 
几 一 So 站 73S 
了 一 一 一 上 一 力 一 ] ) 
lw sl21r TY 
1 SS 7 到 于 7/ 
下 丽 我 们 天 求 1 名 与 全 一 名 时 的 计算 公式 . 外 Y 一 引 : 就 是 最 
人 岂 放 工人 -4 YI -下 
仆 二 乘 估计 的 残 差 平 方 和 ， 必 多 oO 1 1) AN/) 
思 
上 一 和 纤 =Q 一 一 > 00 
t 一 】 
我 们 再 来 证 明 
上 一 名 昱 三 久 五 [CCXXD) 天 1] 16 
事实 上 ,车 记 吕 =X8E 则 8 是 约束 五 8 王 0 下 的 最 小 二 乘 
~ 一 有 7 8 U 7 A 人 人 人 一 中 位 | 二 sw 
计 , 由 定理 3.6 知 有 AER: 使 


1 一 0 
但 
本 / 
X'X8 一 X'Y 
X'X (6 一 月 一 五 和 
一 一 (了 允 / 允 一 1FT7 1 
位 六 和 Aa 人 了 A 是 症 AN 
两 边 都 左 乘 囊 , 由 司 8=0 得 
玉 本 人 证 了 /所 rr 拉 nm\ 一 1 六 AAA。 
一 (tp 三 1 从 放 作 
1] 一 一 「『DU 克 和 -LT -1 FA 
本 到 L_ 全 持 了 了 遂 用 _ 人 





(5. T7) 


-> ) /一 一 了 


| 


在 了 下 下 服从 下 Ga 一 71 分布, 给 定 检验 水 平 。 后 查 相应 自 


由 度 的 下 分布 表 , 得 上 便 ca 分 位 点 《 即 1 一 wa 分 位 数 )c, 可 得 检验 


妃 。 的 否定 域 为  ， 
{( 一 Ch 
开 在 把 上 迟 一 上 方法 用 到 假设 (5 12) 的 检验 上 去 ,此 时 
[5 1 。、 0 
(O) 】 see O 
| : : : 
(oo 0 o 1 


这 时 直接 可 以 看 出 
。 239 。 


| 一 miny Gy 一 B) 


A 全 1 


=- 补 or 一 妨 = 


上 一 5 =17- -总 时 一 47 一 | 


扫 
心 ， 


吉 


轧 
一 1/ 一 (/ 一 \ /61 
yy “7y? LA 人 7/ 
一 1 
声 aa 
一 凡 . 1 
LE 
i 一 1 
了 四 风 t 
7L 
U = 2 太 - 一 Q (5. 18) 


称 U 为 回归 平方 和 ， 在 以 中 避 点 的 比例 大 才 说 明 各 自 变量 二 ， * 
的 确 对 > 有 显著 影响 ， 统 计量 


过 力 YA 下 < 人 一人 5 
下 一 UL (5. 19) 
Q/(2 一 六 一 1 ) 
在 吾 , 下 服从 Fw 6 一 1 分 布 黎 冯 类 辐 归 的 下 综 计量 . 查 
下 是 LN AN 己 97 站 7/ 丰 4 镍 ，4 外 革 [3 | 里 。 全 
上 分布 上 例 分 位 点 印 1 一“ 分 位 煞 )c 可 得 检验 -五 。 的 否定 域 
(FE>>c}. 
才 北 加 妥 自 帮 对 因 变 旺 的 能力 除 可用 (5 19) 的 回归 开 
re 三 人 TYTR A M FHEFE 四 6 三 
用 让 时 个 此 用 中信 们 还 是 吊 作 阴 县 让 关东 杀 从 基 征 信州 
下 一 | 证 (D.L01) 
这 样 
R-/p 


R: 是 回归 平方 和 TU 在 四 还 可 以 证 明 
| 2 一 习 了 -有 
| 一 一 一 -一 一 一 


有 RR“ 一 -一 
(2 一 (六 一 习 2 | 
1 一 1 : 


。240 。 


即 复 相关 系数 是 观测 数据 YI172329 ”yn 加 了 2 .yy 1 1 .92 9 写 
y， 之 间 的 样本 相关 系数 的 况 对 值 . 尺 越 状 就 说 明 . 回 归 方 程 越 精 
Th 由 一 元 [本 上 上 有 忍 认 上 且 、，  。s。 Ai _ _ ”~ | 出入 
人 HH 。 多 见 放 了 回廊 风 必用 yI9 yy2 9 9 yn 与 ZilyZzyy， “hh 二 [OUJ 
样本 相关 系数 的 绝对 值 


数 ， 9 : 
0 是 固定 的 1<k< 有 
ra FT 一 nn .nn1 an ny 有 目 族 和 填 荆 个 分 量 小 
JE HH 襄 苹 攻 UV 9 9 V9 JL 9 V VAN AE 如 人 1 工 。 和 ]。 


末 (XX) 一 厅 王 志 的 第 类 行 第 司 : 列 元 素 $ 设 世 1 一 ( 访 ) )oxz 则 
8 瑟 CECXX) : 琳 ) 6= ( 东 )27[1 


7 

广 Q/ (一 力 一 1) 
在 瑟 , 下 下 服从 下 (1 一 一 1) 分 布 ,给 定 检验 水 平 后 查 出 相应 
F 分 布 的 上 侧 uc 分 位 点 ( 即 1 一 c 分 位 数 )c 可 得 检验 互 。 的 否定 域 
为 {F>c}. 否定 媚 。 则 说 明 变 量 对 变量 ” 有 显著 的 影响 . 这 个 
假设 也 常用 :分布 来 检验 

当 假 设 (5. 13) 中 的 1 时 使 用 统计 量 工 的 表达 式 〈5. 17) 反 

而 不 方便 . 直接 使 用 (5. 16) 更 好 些 . 这 时 
(Gu 一 Q)/:5 


GCT 一 了 


其 中 Q 三 ly- 扣 上 ,QQ=|1Y 一 6 ,Q 是 差 f 方 和 'Q， 也 古 一 种 


67. 演 涝 下 了 009 天 过 上 自 HE 是 记 二 县/ 一 加 
2) 必定 全 /人 只 人 证 赔 之 星 工人] 月 之 里 ZI1， “yp 上 一 一 《rr 9 9 


归 问 题 相 应 的 并 差 平方 和 . 这 样 分 别 计 算出 Q 和 Q. 后 下 


AL 


如 


(上 22)1 
AAAe 上 


(5. 22) 





下 二 
加 


计 天 和 半 一 一 一 人 和、 二 As yi 站 一 r] rr 了 np 


就 很 易 得 到 了 .. 这 样 做 可 以 避免 计算 矩阵 XX 的 逆 . 
在 假设 (5. 13) 下 ,统计 量 FE 一 F(s,n 一 5 十 1). 给 定 检验 水 平 


ew2U 1 2 一 广 L 1 


设 c 是 忆 (sj 一 放 十 1) 的 1 一 wa, 分 位 数 . 由 假 妥 (5 13) 的 和 否定 域 


例 $.3 表 5.3 中 ,为 员 1948 年 不 变价 格 计算 的 英国 进口 
。 34] 。 


商品 和 劳 务 的 指数 ,zi 为 以 1948 年 价 格 计 算 的 灿 国 总 产品 的 日 
数 ,zz 为 进口 痛 而 与 普通 英国 产品 价格 指数 的 比 ， 
计 管 :得 
> 二 
] 一 9， > 一 1052 > 一 1017 >》 7 一 0994 
7 < 一 -yt 二 “名 < 一 ij 二 二 人 访 


之 光一 124 228， 之 太一 115571， 之 ze 二 101772 
忆 yza 一 119 7， 习 yzs 一 113 433， 忆 zaze 一 107 690 


` 表 .5.3 . 英国 进口 数据 四 





于 是 
1 650 ”一 24， 1874 、 
L 一 | 上 [L， 一 | 
，、\ 一 112 648 1 921 
1 _ 11.364 23， 
as 
p， \0. 113 88 
记 一 台 一 让 E4 一 房 元 ?一 一 49.329 7 
回归 式 为 
y 一 一 49.329 7 十 1.364 2zi 十 0. 113 9zs 
解释 平方 和 (回归 平方 和 ) 及 残 差 平方 和 分 别 为 


检验 假设 万 一 育 一 0 的 统计 量 
F 一 -上 一 45.7 
G709 一 2 一 亲 一 2 


而 F(2,6) 分 布 的 0. 99 分 位 数 ( 上 侧 0. 01 分 位 点 ) 才 为 10， 925 ,所 
以 回归 方程 是 显著 的 . 
检验 假设 万 。 :及 一 0 的 统计 量 
1.36422 


了 一 -一 一 一 一 一 90.8 
严 G7C 擂 2 二 1) (0. 001 586)(77.55)/6 
7 1 6 ) \ 全 户 五 分布 的 0 QQ /AN 人 池 fr 7 P 全 | 0 0]1 水 平 耸 位 
IN\L 9 | 目 由 度 的 下 丰 作 有 JU 万 忆 红 人 人 上 人 届 忌 (外 太刀 上 
点 ) 才 为 13.7, 所 以 有 不 为 零 ,rl 对 > 有 显著 影 啊 . 
检验 假设 鼠 :太一 0 的 统计 量 
1、 谎 0. 113 88: 


四 .11:  。 
F 一 天 DC 一 人 一 [00T59077.55J76 一 0.63 


122 门 /1rYQ-D_ 1 (mn On1T KOQTY 
ANWeWwUWwLL ww 


《 
这 个 开 值 小 于 (1,6) 目 由 度 的 下 分 布 的 0.95 分 位 数 ( 上 侧 0. 05 
水 平分 位 点 )5. 99, 所 以 顾 不 显著 ,不 能 拒绝 万 ,zs 对 > 影响 不 
大 . 因此 我 们 把 变量 z: 丢掉 ,建立 y 与 zi 的 新 的 回归 方程 : 
y 一 一 35. 09 十 1. 3457: 
其 和 上 统计 量 为 


FF 有 ， 一 96 40 
(一 UD)/(9 一 2) 


PS 71 TAN 在 LAN QQ Lv 全 rr 上 人 [AAAnN- 亚 4 人 三 \- 症 10D 0 

JU AAA\L9I]LALAJORHJVV vv 岂 U\ RJVVvL/ 人 /JRLCNRA7I JJ AL CC 生 ? 
所 以 回归 式 仍 是 显著 的 . 

Ai 47 THH AL 了 IN 了 -一 A、 人 -DT AAA 

tw。 全 \ 十 二 岂 作 人 伏 22 7/ 凡夫 下 一 和 信任 c++ /人 修 风 日 十 

昌 节 律 (例如 血压 (收缩 压 或 舒张 压 ) 如 何 随时 间 而 变化 ) ,一 些 学 


太一 AM 十 Acos(Cwot 十 g) ， 


其 中 M 是 基准 值 ,A 是 振幅 ,是 相位 ,ow 是 角 频 率 ,例如 w 一 360/ 
24 /0 是 可 类 心 的 生理 指标 . 问题 是 : 设 有 观测 值 风琴) 十 e 


(1 一 1 2 11) ， 这 里 志 是 第 7 个 观测 时 刻 ,sl ，…，e， 是 祖 互 独立 
。 L043 。 


同 分 布 的 随 cv NO 2 Cr 未知) .加 何 估计 A << 
1 AAA 和 AN 7 /AN “mw AAAea 7 mi 亚 丈 Te 
g%<<360 ) 

6 另 人 

1 了 个 i 人 H 


刀 一 MT 十 Acosg。cos oft 一 Asing。sin owti 十， 


| 


一 AD 了 一 Ts。 
\/ 上 9 9 AL] 


f ， 一 | 
HX .y ) YA 了 月 1 VY< 1 [七 ) 
这 里 过 1) 一 COS COt 9 zi 一 Sin ci ， 


8 一 Acosyg， 7 一 一 Asin 风 罗 《5. 23) 
这 便 化 成 了 二 元 线性 回归 模型 


本 


我 们 可 利用 方程 (5. 6) 求 出 8,7y 的 最 小 二 乘 估计 有 ,7y. 
易 知 


鱼 | 
1/ 一 (zi 一 元 )2:， 一》 (z 一 过 )2， 
LAN 一/ 子 22 LA 下 一 ) /′ 少 
1 1 
心 /1 忆 1 起 、 
/1， 一 > (Zi 一 元 )(z 之 ) ， ( 工 王 一 1 之 人 一 7271 | 
“一 \ 7 1 1 
J 
、 杂 。， 
SA v 一 、/ _、 
0 二 2 (Zi 一 元 )(Ji) 一 了 ) | ua 
”1 . -一 
， (了 = 元 站 
)， SN， 一 、/ 一 、 1 
/zy 一 人 (2 一 Z) 作 yi 一 y) 


_ lazly 一 和 02， 一 La 十 572， 


”， 一 
LI1 722 一 2 /72z 一 /1 


M 一 7 一 工 6 一 未， 
从 (5. 23) 可 得 到 A 和光 的 估计 A，y%: 


4 (二 9 (tan 4 一 一 
0 6>0,70 
|9， 有 >0,7<0 
[0 十 180 ， 6<0,7y>0 
Lao-% 6<0,y<0. 


。 LiL44 。 


小 ， 


， / | 、 ， 
其 中 0 一 arctan| | 所 | ] 《0 委 b 委 90 ) 
| D|/ 


于 是 有 非 线性 回归 模型 ， 
一 M 十 Acos(owt 十 罗 ) (5. 24) 
-人 一 一 工 口 四 一 YI TREEDn TS 了 入 Th 人 盖 册 忆 AAA 已 一 人 八 Ar 7A 一 二 人 、TTAA 
jj | / 咯 任 征 只有， 意 娄 了 蛇 ? 女人 忆 嫉 匠 久 人 自信 鲜于 本 和 似 拟 
厂 。 :8 一 7 一 0. 使 用 统计 量 
Fr__ UL2 


人参 . 
Qt 一 (参看 (5. 19)) 
在 万 , 下 下 一 下 (2 ,7 一 3)， 给 定 wcE (0,1) 设 和 上 (272 一 3) 的 1 


9 、 一 w 分 
位 数 是 ); 则 下 ;的 否定 域 是 {F>}. 当 宙 ,被 拒绝 时 ,所 得 到 的 回 
归 方程 (5. 24) 是 有 意义 的 . 在 计算 下 时 ， 注意 0 一 4867， Q= 


人 6 
因 一 U, 这 里 Lo 一 -了 (一 妨 ” 


在 实际 工作 中 ， 和 常 观测 时 刻 是 等 问 隔 的 ， 二 一 十， 

7) 且 ww 一 360* (最 常见 的 情况 是 n 一 12 或 24)， 这 时 上 面 的 计 
算 公 式 均 大 为 简单 . 实际 上 上 ， yz 一 yn cos cut 一 0 >\。 一 
队 Sin wow 太一 0， ziz， > (cos wufj ) Sin o 太 一 0 员 


2 _ 
有 >》, 7 一 
1 
中 ”利用 公式 


0 sin(t 椰 )9 一 sin(k 一 


互 ) 


了 ( 当 分 母 不 是 0) ;、， 
2sin 一 一 
2 外 
“sin cos 外 一 ， 
知道 袜 cos 友 一 三 = 
2Ssih 一 7 
故 


360 时 ， So -0 (7 之 2) 
二 0 
同 理 知 


Sin 允 -0, 呆 osig， sin 怒 一 0 
& 一 0 & 一 0 


。 LZ45 。 








< /1 十 cos 2R0\ 7 1 360、 
>，| 7 ] 一 地。 (0= ] 
他/ 、 2 ) 2 、 7 /) 

其 
同 理 278 一 人 








~ 1 、 本 _， ] 
于 是 M 一 一 / 芳 一 3 当 一 一 ,Tiyi 六 一 二 > jy)， 统计 


1 1 2 


这 里 (4): 一 (8)2: 十 (7)2,Q= 间 一 2(0A). 这 些 都 是 便于 应 用 的 本 
单 公式 。 

(五 ) 回归 模型 的 残 差分 析 

在 讨论 回归 模型 的 假设 检验 (包括 回归 方程 的 显著 性 检验 和 
回归 系数 的 检验 ) 时 ,我们 有 一 个 前 提 : 假定 呈 " 成 立 . 即 假定 模型 


5. 15) 的 随机 项 el ，……，e， 相互 独立 同 分 布 ， 大 同 分 布 征 NO,c ) 


(~ 示 拘 ) 怎样 判别 这 个 “假定 甩 区 月 下 内 心 尼 ? 
4c 亦 知 ). 牛人 杆 州 列 这 岂 下 人 记 肛 这儿 | 


这 是 回 妇 分 析 研究 中 很 重要 的 问题 . 现在 介绍 简单 的 处 理 
根据 数据 (5. 1》, 我 们 可 得 回归 方程 
yy 一 十 记 z 十 … 十 pz， 


今 一 有 十 8 六 十 .十 8 工 . 
已 wy 1 万 0 万 1 人 : 广 刀 一 幼 
ei 一 丸 一 见 (zz 一 1 2，…，71) 
> ”HI 人 外 和 洒 ”一 AN7/ 
一 一 《Li 1 了 隐 /)? 久 全 rrL《 上 \C1》 9Cm 7/ 
刚 E 一 Y 一 X6 一 YY 一 XCX'X)-1X'Y 一 (TI 一 P)Y， 
这 里 P 王 XCX'X)-:X' ,IT 是 单位 阵 . 和 P 的 第 ; 行 第 : 列 元 
素 为 zs. 则 在 “假定 B” 下 上 服从 ” 维 正 态 分 布 , 且 
Cov(e,e) 一 只 (T 一 也 ) 
T"” -人 <7 -2r1_ AN 
必 CE; 一 WU， V aiv\ei/ 一 0 上 Pa/ 
令 


这 些 y 叫做 学 生化 残 差 . 数学 上 可 以 证 明 ( 参 看 
全 一 中 1 HA 可 二 HL AL 有 可 一 AJ 2 和 


着 [15]) ,在 “假定 B?” 下 ,只 要 对 相当 大 ,7 ，…7, 近似 地 相互 独立 
同 分 布 , 且 7 近似 服从 标准 正 态 分 布 . 

由 此 知道 ,如果 “ 假 定 如 成立, 又 比较 大 , 则 7 和 …,7y, 中 大 
约 有 [L0. 95 中 个 六 满足 1z | 委 2. 帮 根据 实际 数据 (5.1) 算 出 的 
,7 中 有 较 多 的 y; 不 满足 这 个 不 等 式 , 则 应 拒绝 “假定 了 
当 2” 较 大 且 不 能 拒绝 “假定 ?时 ,一 般 应 承认 “假定 B” 当 不 太 
大 时 还 应 考察 “ 残 差 图 ”, 详 细 讨 论 见 [15]. 

当 “ 假 定 如 ”被 拒绝 时 , 往 下 怎么 办 ? 这 时 应 对 数据 点 
(za Zaoyy) 进 行 过 细 的 研究 ,要 剔除 “异常 点 ”, 这 些 属于 回归 
诊断 的 内 容 , 见 L15]. 

(5. 25) 中 的 加 应 如 何 计算 呢 ? 可 以 证 明 下 列 公 式 成 立 


S 


力 : 一 一 十 (zz 一 元 ) 了 工 -(ze 一 元 ) 


也 一 (0)oxp， 有 一 >》 (ze 一 元 (zy 一 雹 .)) 
一 1 
-一 一 一 -一 A ， A 
之 一 ( 工 .1 ，… ， 工 .，) 9 Z ”一 (ZilyZizy。 … Zi) 
|rv 4 
| 
~- ，，，、 
1 《1 和 1] 和 全 也/ 
小 蕊 号 上 记 -1 S 
了 帮 J9 三 上 
| | ] 1 _ 一 \ 人 2 7 一 NA AC mmAN 
Pa  / 工人 ~ 一 -71/) VD。L2ODV/ 


。 247 。 


雹 一 二 yz ， 7/ - 2 rr 一 了 3 


以 上 就 是 对 回归 模型 进行 残 差 分 析 , 用 以 判别 “假定 B" 是 否 
成 立 (当然 , 残 差分 析 还 有 许多 别 的 用 处 ). 为 了 显示 这 种 分 析 的 必 
要 性 ,我 们 提出 下 列 例子 . 


本 本 于 本 


例 $.S 放 有 下 列 两 组 数据 : 
第 1 组 





今 对 这 两 组 数据 分 别 建立 一 元 线性 回归 方程. 经 过 简单 的 计算 知 
六 一 42， 2 一 2 二 22 2 一) 一 79,27zoi = 


> ,zizi 一 120 .由 此 知 这 两 个 组 对 应 的 回归 方程 是 一 样 的 ， 


y 一 0. 5 十 0. 5z， z 一 0.5 十 0. 5z 


而 且 第 1 组 对 应 的 统计 量 已 一 6 全 = 875(U, 是 第 : 组 数据 对 


应 的 回归 平方 和 ,Q， 是 第 ; 组 数据 对 应 的 残 差 平方 和 ) ， 第 2 组 对 
应 的 统计 量 丈 王 6 床 =?， 875 王 慰 . 从 而 两 个 回归 方程 都 在 检验 
水 平 c 一 0. 05 上 是 “显著 的 ”( 下 分 布 相 应 的 临界 值 是 人 一 5. 99< 
7.875). 这 样 看 来 ,似乎 同一 个 回归 方程 拟 合 两 组 数据 都 是 合适 
的 . 其 实 不 然 . 我 们 来 看 看 各 组 数据 的 散 点 图 (图 13 是 第 1 组 对 应 
的 散 点 图 ,图 14 是 第 2 组 对 应 的 散 点 图 ). 
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加 图 14 

儿 13 
Id 人 人 ID MA 巡 1 OH 学 FE- 计 - 直 -二 p RE 、 FA 和 
外 有 和 侈 工 人 外 和 谋 月 山 ， 肌 二 -也 有 四 人 上 已 一 Pd 了 7 


在 _- 直线 附近 ， 为 确切 起 见 ， 我 们 利用 公 趟 (5 25) 和 (5 267 计 算 各 
组 数据 对 应 的 学 生化 残 差 ， 结果 如 下 | 


本 7 一 一 上 上 一 一 上 一 站 7 


六 | 7 思 人 5 7 7 as 
第 1 组 | 1.134 一 1.016 一 0.956 0.929 一 0.9?9 0.956 1.016 一 1.134 
第 2 组 | 一 0.567 一 0.508 0.478 一 0.464 2.323 一 0.478 一 0. 508 一 0. 567 





从 这 张 表 看 出 ,第 1 组 对 应 的 所 有 7 均 满 足 |1z| 坟 2, 放 可 认 
为 "假定 中 "成立 ,因而 对 这 个 组 的 回归 方程 的 显著 性 检验 是 有 效 


OKw 一 0. 05). 对 于 第 2 组 来 说 右 vv 江 只 | | 人 0 因而 不 能 认为 


辆 中 We 2 一 -一 Lv AU 7 门 yi; 1 ”PR 己 2N AAA 


假定 如 "成 立 , 对 回归 方程 所 做 的 显著 性 检验 无 效 . 总 之 ,用 回归 


一 5 十 0 KE” 二 人 和 略 1b 昌 江干 目 - 友 I hu TH 二 和 六 这 3 
/J 鱼 YY 一 了 Us UV ] 纵 日 绪 上 和 如 和 站 让 月 业 日 JJ，D 门 不 过 1J JJ 丰 


测 或 控制 ;用 回 妇 方程 xz 三 0.5 十 0.5z 拟 合 第 2 组 数据 缺乏 根据 ， 
人 
六 ) 第 二 类 回归 简介 


4 与 之 19.2 9 9 尼 思 都 是 随机 变量 ,要 找 了 Zi 9 之 2 9 ” ,Z ) 使 
。 2Z409 。 


则 对 于 一 切 Ji ?2 9 ,Z) 有 


FT" AN 12- 一 要 六 Ar 。 人 N]2 
一 LJ DCZI1y，Z2 ?bp 7 LVy JI9Z29 ?pb7 


这 个 op 叫 做 回归 函数 , 它 一 般 不 易 求 出 ,因此 只 好 缩小 函数 类 , 限 
定 /是 线性 函数 ,只 要 找 尺 ,B，… 访 使 得 ELy 一 ( 吧 十 岂 立 十 … 二 
pzo)】 达到 最 小 ， 

志 








8， [zj 
R. 一 Cov(X,X)， R 一 ELCX 一 EX)(Cy 一 已 y)] 
则 拟 合 误差 的 期 望 值 
Q(C8 ,8) 一 五 (y 一 房 一 了 和 ) 
一 开 [(y 一 下 y) 一 8 (X 一 下 X) 十 已 > 一 (由 十 B 开 和 )]? 
一 匹 (y 一 匹 y 六 十 BR 尽 -8 一 28 民 -十 多 
其 中 6 一 By 一 ( 岂 十 BEX)，Q(C8 ,8) 的 最 小 值 在 应 ,5 处 达到 ,5 ,/ 
R..6 一 R.， 
六 BEy -BEX 


"2 十 BR 8 一 28RR。 ,十 及 .6 十 


7/ ! CA 人 zl 人 人 工 工 二 
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0 六 
也是 理论 上 悉 型 拟 合 的 参数 ,但 实际 应 用 时 只 能 得 到 如 (5， 1) 那 样 
册 cv Ha 下 、 鸭 ) 上 ~ 六? 一 Ar 门 论 忆 7 1 人 
日 克 久 了 T ， 理论 土 的 人 必 rzz 二 zy 不 几 ， 公有 上 昌 直 全 
1 
yy 一 一 .yi 
1 ;=1 
_ < | 
去 .; 一 一 -Ri 9 1 一 1, 2，…y 力 
7 二 1 


Li 一 一 (Zi 一 工 .;)ZU 一 工 .7)， 121 一 ,2 力 


及 一 了 2 (zu 一 元 )(2 一 习 ， 一 12 


了 -一 (人 L; ) pxp 


Lv 一 【4 ) xl 


用 工 和 工作 为 尺 和 和 估计 ,并 假定 (5.1) 的 前 户 个 列 线 ， 
IJ 2” ML TY 记 AAA ZITITOTIN yy HR IN 73A 1 LA 人 、 了 7 mv HHJ AP | 7 JJ 一 人 | 一 
无 关 , 则 得 记 ,8 的 佑 计 为 
方 一] 了 
…” 户 一 二 va 
po 一 一 让 ZI 一 人 一 PT 
谋 与 第 一 类 回归 的 计算 公式 完全 相同 . 
第 二 类 回归 中 如 果 假 定 变量 y,zxi ,…，zs 的 联合 分 布 是 多 元 
可 一 一 一 1 7 7 六 于 人 一 人 
正 态 分 布 , 那 么 可 以 证 明 条 件 期 望 正 (y|zi，…,zp) 必 为 ， 
or es 出厂 LE 光 FI HT 县 例 [II 2 必定 是 | 上 
咏 2 》 .j 日 JJ | 革 了 卫 儿 yy 鸭 UL 过 有 也 饶 回 轨 内 定 古 线 性 回归 . HI 


于 正 态 分 布 在 实际 工作 中 大 量 出 现 , 所 以 线性 回归 在 实际 工作 中 
有 广泛 的 应 用 . 
(七 ) 关于 回归 分 析 的 几 点 注意 事项 
(1) 对 实际 冶 题 ,要 根据 问题 的 物理 背景 适当 地 选择 模型 . 
有 些 问 题 中 已 有 成 熟 的 理论 或 经 验 ,如 下 面 的 例 5.4; 如 果 没 有 


一 一 2 门 天 AS 玫 - 下 四 的 鲍 >， 9 AHKAIN 1 


在 
理论 的 指导 可 以 用 不 同 的 模型 进行 比较 ,一 般 地 ,可 以 比较 模型 的 
”251 。 


回归 正统 计量 的 值 , 值 越 大 ,说 明 模型 越 合适 ,同时 还 可 以 看 一 看 
红 兰 三 图 而 言 ) ,图 上 的 点 应 该 随机 地 


HX RE 不 外 小 过 /网 同 ， 疡 以 改 

- 例 S.6- 放射 性 会 (is Au) 对 发 炎 的 组 织 有 素 和 力 ,有 财 在 座 
洒 关 节 类 时 操 它 有 果 作 示 : 跤 元 素 硼 5 4 为 注射 ,rr 天 记 和 湾 册 的 个 
世 1- 作 了 上 -人 八 JL 已 用 第 不 踩 匹 际 . 人 人 | 刀 AL LTFJRYV 


元 素 残 留 百 分 比 y, 共 7 一 10 个 血样 . 
表 S$.4 示 踪 金 元 束 残 留 量 数据 





天 
1 
和 
2 71 
4 80. 5 
2 81.4 
3 | 67.4 
5 49.3 
| 4 8 
6 42. 3 
7 36.6 





从 散 点 图 ( 见 图 15) 来 看 工 与 的 关系 不 太 像 是 线性 的 ,而 且 
放射 性 元 素 的 误 变 从 物理 学 来 讲 遵 从 负 指 数 规律 ,所 以 拟 合 模型 


y 一 ae ， 有 ln y 一 jn “十 6, 进行 回归 拟 合 得 
人 一 104. em 146.2x 


96.78 一 8.876x 
其 工 统计 量 值 为 178. 8 , 仍 在 0: 000 1 水 平 下 是 显著 的 ,只 比 负 指 


数 模 型 略 差 . 这 是 因为 曲线 在 局 部 可 以 用 直线 很 好 地 逼近 . 


(2 佳 用 回归 - 方 小 一 “- 定 要 注意 的 是 即使 建立 了 回归 式 并 F] 


AI 人 六 负 睫 万 全 趟 导电 昌 证 和) 人 十 认 NT 下 L 


统计 检验 证 明 相 关 关 系 成 立 , 也 只 能 说 研究 的 变量 是 统计 相关 的 ， 
。 2Z02 。 
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图 15 放射 性 金 丈 素 的 请 减 
而 不 能 就 此 断定 变量 之 间 有 因果 关系 ,因为 变量 y 与 变量 z 线性 


AP _A vv AP 后 人。 -< 和 王 ! 并 一 pm IE 产 .Th ET 一 一 


相关 有 可 能 是 它们 都 受 另 一 个 变量 的 线性 影响 ,而 > 和 <z 之 间 
前 能 根本 没有 什么 因果 关系 . 比如 国外 有 人 公 现 喝 嘿 啡 的 习惯 己 


冠 心 病 的 发 病 高 度 统计 粗 关 ,于 是 就 有 些 文章 声称 咖啡 是 危及 人 
们 健康 的 一 个 隐患 ,后 来 进一步 的 研究 发 现 , 喝 咖啡 者 较 高 的 冠 心 


病 发 病 率 是 与 吸烟 和 蔗糖 摄 和 人 有 关 ， 而 这 两 者 与 喝 咖 啡 的 习 惯 都 


心 
一 
， 
(CD 
必 


(3) 回归 的 因 变 量 选 定 后 , 目 变 量 的 选择 十 分 重要 .如果 遗 


温 了 了 重要 的 解释 本 最 下] 模型 不 能 正确 反 有 和 衬 际 情 六 而 日 会 尖 
二 本 所 女 有 有 人 件 莹 量 ? 公庄 宇 外 有 二 鲍 区 和 大 [水 睛 岳 汪 电 了 从 双 


估计 是 有 偏 的 . 如 果 自 变量 之 间 有 近似 的 线性 相关 ,这 时 模型 中 
的 估计 量 很 不 稳定 ,参数 估计 的 方差 很 大 . 下 一 节 讲 的 回归 自 变 
量 选 择 方法 只 解决 了 部 分 问题 ,在 选择 自 变量 的 问题 上 还 是 要 进 
行 深入 的 分 析 研 究 ， 

(4) 用 回归 方程 作 预 报 或 控制 ,必须 考虑 对 要 研究 的 变量 有 
影响 的 各 种 未 引入 模型 中 的 因素 是 否 有 变化 , 即 问题 的 背景 是 否 
发 生变 化 . 如 有 变化 ,那么 原来 的 经 验 公式 在 变化 了 的 情况 下 可 


能 不 再 适用 ,需要 重新 进行 研究 . 比如 ,政府 政策 的 大 的 变动 就 可 
能 影 啊 到 许多 经 济 变 量 之 间 的 关系 . 
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归 分 析 中 和 党 把 所 
忆 刀 由 TD 人 


啊 因 Th 
2 9 ”9 人 b 都 列 出 来 ,根据 区 它们 的 观测 数据 媚 立 包 对 之 1 9 过 2 9 ”9》 迟 pb 的 回 贞 | 
方程 . 这样 做 的 一 个 缺点 就 是 可 能 有 一 些 自 变 量 对 y 的 影响 很 小 甚至 没有 


是 Ar FA 和 


影响 ,但 也 列 人 了 回归 方程 中 ,增加 了 取得 数据 和 分 析 数 据 的 负担 , 旦 得 到 的 
回归 方程 过 于 复杂 ,不 便 使 用 ,另外 ,从 随机 误差 项 方差 oz 的 估计 空 = 
Q/(z 一 一 1) 来 看 ,多 用 自 变量 不 一 定 导 致 较 小 的 空 ， 所 以 ,我 们 应 该 建立 
这 样 的 回归 方程 , 它 包 含 z ,zz ,zs 中 那些 对 y 的 影响 不 可 忽视 的 变量 ， 
但 不 包含 那些 对 > 影响 不 大 的 变量 , 即 从 {ziyzz，…z) 中选 出 一 个 适当 的 


子 集 {z， ,z ，…，zi } 使 得 建立 的 回归 方程 丛 含 有 这 个 子 集 的 变量 . 这 就 十 
著名 的 回归 自 变 量 的 选择 问题 ， 

回归 自 变 量 的 选择 问题 在 应 用 上 和 理论 上 都 十 分 重要 ， 从 上 世纪 60 年 
代 以 来 受到 了 广泛 的 注意 . 这 个 问题 的 头 一 个 困难 是 怎样 比较 不 同 选 择 的 
优 劣 , 即 最 优选 择 的 标准 . 父 不 同 的 角度 出 发 ， 可 以 有 不 同 的 比较 标准 ,具体 
介绍 如 下 . 

以 下 将 自 变量 z ,zs ,zs 用 代号 1,2,…' 力 来 表示 , 记 TI 一 {1,2，…，, 力 }， 
T 是 可 取 的 自 变量 的 全 集 . 设 4 是 TI 的 子 集 , 则 A 对 应 一 种 自 变 量 选 拼 
tiEA). 记 #(A) 为 人 A 的 元 素 个 数 . 看 A=( 人 yz) <z<<…<2)， 
把 X= (zz )xs* 的 第 列 ,第 2 列 ,…, 第 六 列 抽出 来 组 成 的 矩阵 记 件 
X(A). 从 数据 (XGA),Y)(Y= 一 (my ，…y) ) 出 发 用 最 小 二 乘法 可 得 回 少 
方程 


> 
时 
本 
二 
洱 
本 
尝 吨 
全 
世 
T 
上 
由 


| 一 二 


y 一 反 (4) 十 >》 房 (A)z (6. 1 ) 


JEA 


这 叫做 与 A 相应 的 回归 方程 ,其 残 关 平方 和 与 回归 平方 和 分 别 为 


~ ， ) 
Q(C4A)=‖y 一 XC4)6CA)|: (9 
U(CA) 一 瀛 一 Q(CA) (6. 3) 
其 中 
了 T 册 和 -艺人 信 十 友 0D0pp 人 西 上 cr 人 56 站 人 [人 2900 半 表 龙 人 Le 了 住人 小 
《 日 J 了 」 本 信人 月 | ， 女人 八 于 jj” 人 .| 了 耻 人 L 忆 LU HRJI 人 女人 志 | LU JJ UL 





的 标准 . 常见 的 比较 标准 有 下 列 几 种 
(1) 平均 残 差 平方 和 最 小 ， 即 找 人 使 
_ Q(A) 
一 1 一 井 () 
达到 最 小 . ， 
《2) 平均 预测 均 方 误差 最 小 - 即 找 A 使 
， 7 十 井 \ 人 4) 十 1 
,一 i 井 CA) 一 1Q(A1 
达到 最 小 ， 
(3) C， 统计 量 最 小 . 即 找 A 使 
昌 | 二 QCA) e 一 一 
GD7CO 二 7 亲人 
达到 最 小 
(4) AIC 准则 . 即 找 双 使 
AICCA) =in Q(A) 十 2 ， 人 
达到 最 小 . 
(5) BIC 准则 . 即 找 A 使 
BICCA) 一 In Q(CA) 十 井 (A) 。 呈 并 
172 


达到 最 小 . 

这 些 准则 都 有 一 定 的 道理 ,很 难说 其 中 一 个 比 另 一 个 好 ,它们 的 理论 基 
础 仍 值得 探讨 . 这 样 ,我 们 要 找 最 优 回 轨 方程 就 很 难 做 到 . 不 过 ,实际 工作 
希 常 常 并 不 追求 "最 优 ”, 只 要 能 找 出 比较 优 的 回归 方程 就 行 了 ， 下面 定 义 的 
+ 写 取 的 回归 方程 "就 是 一 种 比较 优 的 回 轨 方 程 . 

给 定 ACTicA,Q(A 一 () 一 Q(A) 可 用 来 刻画 变量 zx 在 回归 式 (6. 1) 
中 的 作用 (等 价 地 可 用 U(G4A) 一 U(CA 一 (让 ) 来 刻画 ). 这 个 量 叫 做 关于 A 


的 偏 回 归 平 方 和 , 记 作 P,(A). 考虑 


d 忆 (A) 
六 (4A) 一 一 一 一 一 一 (6. 4) 
Q(A)/(Ca 一 1 一 井 (A)) 
SA AN 内 大 ~- FE mh 一 LA 有 ph FE LA _【、 人、 AAA 性 TREE 人 人 、 光 [ 盖 本 mm 一 
FA) 的 大 小 反 上 映 了 xz 在 子 集 A 中 作用 的 大 小 . 给 定 两 个 数 FE#t Eu 0 魏 
下 委 卫 进 


定义 6.1 称 子 集 4 是 可 噜 除 的 ,如 果 存 在 iiEA 使 得 
反之 称 4 为 不 可 剔除 的 . 称 子 


称 子 集 A 是 宜 取 的 , 若 它 是 不 可 剔 


本 IT La AN 9 LA 一 4 JI RATU 


回归 方程 (6. 1) 称 为 宜 取 的 回归 方程 . 言 取 的 回归 方程 是 比较 优 的 ， 大 量 实践 
表明 ,只 要 Fs 和 Fu 取得 适当 (通常 取 Fe 一 Fu 在 [3， 8 内 ) ,得 到 的 宜 取 回归 
方程 颇 有 实用 价值 ,利用 它 进 行 预测 和 控制 往往 令 人 满意 ,因而 受到 实际 工作 
者 的 欢迎 . 但 是 , 宜 取 子 集 可 能 不 止 一 个 ,究竟 哪 一 个 更 好 , 宜 取 性 和 上 面 介绍 


BA 站 和 和 hb 优 和 性 准 由 有 什么 关 有 委 六 此 问题 都 在 徒 于 并 二 目的 理论 抵 讨 


vvA AU ZU LI 六 站 11 AAA 人 个 7 人 一 1 4 全 上 2 和 2 了 -一 YL JJ。 


既然 宜 取 的 回归 方程 有 实用 价值 ,怎样 从 原始 数据 出 发 得 到 它 呢 ? 使 用 
著名 的 逐步 回归 法 就 可 得 到 一 个 宜 取 的 回归 方程 .现在 来 介绍 这 个 方法 ,其 
要 点 是 从 空 集 出 发 逐步 引 和 人 自 变量 ,同时 剔除 相对 而 言 不 重要 的 自 变量 , 直 
到 不 能 引入 新 的 自 变 量 也 不 能 剔除 为 止 . 下 面 用 数学 归纳 法 给 出 逐步 回归 
法 的 严格 表述 . 用 4A, 代表 第 上 步 建立 的 回归 方 稳 所 含 的 自 变量 的 足 标 组 成 


的 集合 . 


冲 到 


4 相应 的 


第 0 步 . 令 4.= 他 ( 空 集 ), 这 时 回归 方程 是 
y 一 了 (6.5) 
第 1 步 . 考虑 引入 自 变量 . 对 所 有 :ET 分 别 计算 
= 分 一 QCtz ) 
(这 里 'QC 杂 )= 上 ). 找 羡 满足 
F 《1 一 max 碧 (1 
< 说 ET1 7/ 其 人 【7 
如 果 已 【1{ 人 iD)<<F ,这 时 逐步 回归 过 结束 ， 最 后 的 回归 方程 是 (6. 5); 如 
了 FI ANVN、 nl 让 肯 人 A 一 1 : \ 计 确 下 已 AH RE 
个 1 (一 ,这 时 9 人 昌 变 量 ZU 4 NI 下 直人 18 
妇 方 程 
y 一 序 (4 十 记 (Am (6.6) 
第 2 步 . 考虑 能 否 引 入 新 的 自 变量 . 对 所 有 ET 一 A 分 别 计算 
FA UNyQCAD 一 Q Q(CA U (1 ) 
CUGD7C 一 3 


一 本 一 


上， (4A， U (za ) 一 IaX- 人 U 《2 ) 
若 Fi (AUt 人 ta) 六 和 安 下 , 则 逐步 回归 过 程 结束 ,最 后 的 回归 方程 是 第 1 步 得 


人 页 记 一 -3 了 7TA AN -证 下 (4 1111 ”ANV>~、 厂 TI FF 人 xi 有 且 一 人 4A 二 1， ”人 \ 并 
地 DJ JJ TEAVU 7 人生 于 tp 、\4 人 IANAz21 7 一 荆 得 》 ?仆人 二 一 tp 9 《12 人 tl9tk21 7 


建立 与 4: 相应 的 回归 方程 .…- 


设 上 面 的 过 程 已 进行 了 步 ( 达 ) ,得 的 自 变量 的 足 款 集合 为 A,, 相 
应 的 回归 方程 是 | 
诱 一 房 ( (0 二 名 CA 和 (6. 7) 
iC A， 


和 一 


第 上 十 1 步 . 先 考 虑 能 否 剔 除 . 对 每 个 ie 4, 计算 
四 已 (CA 一 - Q(CA 一 (人 )》 一 QKA，) 、 
1 QCADVCn 一 1 一 井 ( 鸡 )) 


找 z 使 
FF (《A， ) 一 下 旭 攻 (A,) 


如 果 忆 (AD 和 Fa , 则 令 Ai 一 乓 一 (时 遇 除 二 , 建立 与 4A+: 相 应 的 回 
归 方 程 ,然后 转 人 第 :十 2 步 ; 如 果 忆 (4 )>>Fa ,这 时 不 剔除 ,考虑 能 否 引入 


新 变量 . 对 所 有 ET 一 人 计算 


六 AAA 1IIITN Q(CA4A,) 一 Q(CAU(z)) 
GCCRUU)7 一 2 一 井 (A)) 


找 z 使 

上 (4 Utazo 几 一 max 王 《AL (2 7) 
如 果 F，(A,U (ia)) 生 Fe , 则 逐步 回归 过 程 结束 ,最 后 的 回归 方程 是 (6. 7); 
如 采 上 (AU(tazo 7 二 下 进 , 则 引 . 人 fn , 令 4 三 从， Ultai} 并 建立 与 4,+ 相应 


山上 [1 一 一 一 工 上 2 _| 0mD 上 
市 J 回归 方程 , 转 人 第 Z 1 CC Z。 


这 样 我 们 用 妇 纳 法 给 出 了 逐步 回归 算法 的 全 过 程 。 这 个 过 程 可 直观 地 
描述 如 下 ， 自 变 量 是 逐步 引 人 的: 每 引 入 一 个 新 恋 量 ， ,要 先 检 查 先 订 引 人 方 


本 Se ”本 -人 


程 的 变量 是 否 要 剔除 , 若 有 可 剔除 的 ， , 则 从 影响 最 小 的 开始 噜 除 直到 没有 变 
基 可 剔除 时 再 考虑 能 否 引入 新 的 变量 , 若 能 引入 , 则 先 引 入 影响 最 大 的 新 变 
量 , 引 入 后 马上 考虑 原先 的 自 变量 是 否 要 剔除 ,……, 到 无 变量 可 剔除 时 再 考 


谍 引 和 新 的 变量 . 此 过 程 进 行 到 不 能 绸 引 和 人 新 变量 为 止 . 这 时 得 到 的 回归 
方程 便 是 宜 取 的 回归 方程 . 算法 的 框图 如 图 16. 


和 we Ai 一 有 一 Ra 是” | [上 | 


和 一 


逐步 回 当 既然 是 又 引入 又 噜 除 ,那么 它 就 有 一 个 能 否 在 有 限 步 
题 . 答案 是 肯定 的 ,严格 证 明 如 下 . 











图 16 
记 
二 上 一 一 务 和 大 
”7 一 一 1， 一 > 1” 7 一 ) 刀 . 
0 委 a 委 / 
且 不 难看 出 , 子 集 A 可 剔除 的 充 要 条 件 是 存在 ;iEA 使 
Q(CA 一 (人 要) 一 QCA) 已 (CA) 四 
QC4) 一 一 一 入 4。 (7 一 提 (4)) (6. 8) 


子 集 A 不 排外 的 充 要 条 件 是 存在 ;ET 一 A 使 


人 


QC) 一 QCAU 人 -ECAU 人 GD = 半 CA) (6.9) 


wa AI 1Y 


CCAU1z  ) 7 -一 太一 L 


对 了 工 的 于 集 A ,定义 


其 中 m 一 1,o 一 1 十 2 (一 1,2,…，, 力 ). 
引 理 6.1 设 :之 0. | 
(1) 大 4, 可 剔除 , 则 
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Q(CA4A,) 之 


(2) 在 A, 不 可 剔除 但 不 排外 , 则 














A， 
QCA)> QQCA) 
证 明 :(1) 若 A, 可 剔除 , 则 第 :十 1 步 剔 除 一 个 自 变 量 得 到 A,+: ,于 是 由 
(6.8) 式 可 知 
AT) 一 QCA， 
人 (> 一 井 (A,)) 
| 一 
AN II 
QC4) > 下 一 QC4D 二 ErQCAA) 
一 一 1 十 a， 不 和 
] 
:十 1 7 
手 夺 
一 CO)aOCA ) 
Q( 人 及 ，) 


(2) 大 4. 不 可 噜 除 但 不 排外 * 则 第 上 十 1 步 必 引入 一 个 新 变量 得 到 


刁 -hyrA An 一 性 天 刘 虽 
Ai ,于 古 由 \Uvv7dJTr-j 败 


CC 一 QCA+DD 5 (r 一 #(《A,)) 
CA,+1 ) 


从 而 





(4,) 二 (1 十 pp)QC4N 一 


人 ) 


axCA,) 





Q(C4.) > ATJTCCAe 1) 
证 明 :多 次 使 用 引 理 6. 1 中 的 不 等 式 即 得 . 
引 理 6.3 ” 设 0 委 上 < 上 !，4,，: 不 是 宜 取 的 且 # (4.) 委 # (AD), 则 QCA,)> 
Q(CA,). 


证 明 : 从 条 件 #(A,) 委 井 (4) 及 友和 知 必 存 在 Ai4<</， 使 得 4 是 不 
可 剔除 的 . 由 引 理 6. 2 即 知 


1 
Q(A， ) > 一 Q(A,) 二 Q(CA，) 
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生 


. 工 震 临 界 值 FaFu>0, 则 逐步 回归 法 的 解 选 变量 过 


证 明 Q :用 反 证 法 人 则 得 到 子 集 列 Auo ,A, ,A: ,… 
由 于 不 同 的 子 集 至 多 有 2 个 , 故 存 在 上 上 使 得 4 =A, 从 而 Q(CA)= 
Q(4,), 这 与 引 理 6. 3 的 结论 相克 看 , 故 乏 步 回 归 法 的 变量 箭 选 过 程 必 在 有 
限 步 后 停止 . 

逐步 回归 的 计算 有 简单 的 递 推 公式 ,所 以 计算 量 并 不 大 ,许多 统计 软件 
包 中 都 有 计算 逐步 回归 的 程序 ,实际 工作 者 很 乐于 采用 . 


$S7 逻辑 斯 请 (logistic ) 回 归 模 型 


在 前 面 介绍 的 经 典 线 性 回归 模型 里 , 因 变 量 ( 啊 应 变量 ) 是 连 
bp TIR 四 ”总 一 人 rr Ht Di 目 3 AT 基站 iT \ 涪 、 
< 大 福 里 . 仁 关 | 孙 二 TF (特别 是 社会 现象 的 全 究 ) 贡 遇 到 因 变 量 只 


实 中 人 
取 分 天 但 ,元 基 是 只 4L 取 二 分 类 值 ( 即 0 或 1) 的 情形 ,这 时 就 不 能 用 


aa 


,用 z 表示 一 个 家 庭 的 年 收入 ,Y 王 1 表示 


对 户 的 研究 等 价 于 对 - 5 的 侠 究 ， 因为 后 者 是 嫁 的 严格 增 连 


续 明 数 ， - 己 _ 叫 作 发 生 比 或 优 比 (odds ratio ) 





本 一 轧 
定义 7.1 如 有 果 有 下 列 关 系 式 : 
加 力 < 
mnITD 一 负 T2ZPrz， (人 7. 1) 
2 一 ] 


中 这 里 给 出 的 证 明 是 根据 江 泽 培 先生 的 证 法 改写 的 . 
忆 200 二 


(其 中 所 ,9 ，…, 8 是 常数 ), 则 称 


” 7 了 7 


9 人 了 
与 目 变 量 之 1] 9 ”9 的 关系 符合 逻辑 斯 详 模 型 
二 站 ( 人 太 划 7 这 ”HI 有 羡 妇 一 DA 一 1 | 一 
/JJ | 近 上 和 与 Z1，， 9 DJ 人 尔 ， 有 天 二 和 人工 上 | -1， 


,DA ) 。 (7 . 1) 有 下 列 等 价 形式 : 


民 
exp1 记 十 > pzi;) 
P(Y 一 1|Zz，…, Zi) 一 - 


1 十 exp{p 十 2 pzi| 


在 (7.1) 中 ,A ,9 ,8 通常 是 未 知 的 ,需要 利用 数据 进行 估计 . 
一 旦 这 些 参 数 的 值 确定 了 ,(7. 1) 式 就 可 用 来 对 话 进行 预测 ,也 可 
用 来 对 各 自 变 量 的 重要 性 进行 评价 . 


ee [1 


为 简单 计 ,以 下 只 考虑 & 一 1( 即 一 个 日 变量 ) 的 傅 形 ， 用 z 表 


示 袜 , ,这 时 (7. 1) 化 为 


7 AKC 一 人 “ 4 - 





_ 力 几 
in- 尼 _ 一 和 十 Brz (7. 2) 
1 一 卢 
令 bz 一 P(Y 一 11z) ，, 见 
本 进 六 区 一 | 一 7 3 AAA 
(站 一 -expt 鳃 BRz (7. 3) 
20 】 | 
志 / -一 
P 1 十 exp{t 十 序 工 } 
怎样 仕 计 夫 知人 参数 8 _o 上 归 ， 涌 沿 志 两 个 办 涛 . 晶 大 们 包 仁 计 深 
te 1 1 AT An 有 人 0 六] 已 JI TH -亲人 JJ 1 LA To ee LA 上 了 1 Tc 个 全 


加 权 最 小 二 乘法 . 
最 大 似 然 法 : 设 有 下 列 数据 :z=z 时 的 值 是 y (=1， 
2,… ,72),y 一 0 或 1. 应 注意 ,这 里 > 人 不 是 
(7.1) 中 的 第 守 个 自 变量 ! 
显然 ， 
P(Y 一 交 |z) 一 (zi))(1 一 加 (zi))I > 
于 是 观测 值 (zi,y )，…，(zvyyv) 对 应 的 似 然 本 数 是 


L(B8 ,9 ) 一 ITcecr ))> (1 一 六 (zz ) ) > 


从 而 
"261 ， 


In 工 (A ,8 一 yy (CR 十 序 Ti) 一 SN ln(1 十 e 5 ) 
;二 ] 二] 


少 


2 :8 (一 0.1) 
C 1 





< / ; 
2 2 一 Texp( 和 TARZT) 
< exp{( 世 十 BTi》 、 
全 攻 exp( 记 十 和 2/ 一 

若 ( 记 ,) 是 似 然 方程 组 的 根 , 且 zj ,…，,z 不 全 相等 , 则 似 然 
方程 组 的 根 是 唯一 的 ,而 且 (8. ,9 ) 是 工 (2 ,8 ) 的 最 大 值 点 ,因而 
序 ,6 分 别 是 ,8 的 最 大 似 然 估计 (可 以 证 明 :ln 工 (8& ,8 ) 是 二 元 
严格 各 函数 ). 但 应 注意 的 是 , 似 然 方程 组 有 时 无 根 ( 例 如 所 有 y 
都 是 1 的 情形 ). 在 SAS 和 SPSS 等 国际 流行 的 软件 包 里 都 有 计算 
最 天 傣 然 估计 于 局 咒 | 的 程序 ， 





人 下 太 


作 耿 次 观测 (nm 掖 大 ) ,其 中 事件 1 1) 发 生 了 关 次 G 一 1 
2,… ,7), 这 里 已 1 9 ”” ”9 必 7r 两 两 不 同 . 通 稼 用 





z -In_2T05 (7.4) 
1; 一 1 十 U.D 
力 ( 工 ; ) 。 
作为 ln 一 的 估计 值 (i 王 1,2，…… ,7 )， 
| 力 (Zi ) 
今 


一 CCuaT2) (一 上 77) (7.5) 
7、\ 关 一 7 十 |) 


GQ(p 一 呈 二 (= 一 一 Bi) 
使 QC8 ,8 ) 达 到 最 小 值 的 画 ,5 分 别称 为 & ,P 的 加 权 最 小 二 乘 估 
计 . 这 里 二 ,二 就 是 所 谓 的 权 . 可 以 证 明 ,加 权 最 小 二 乘 估计 存 


202 。 


在 日 唯一 . 令 3Q4 ,8 - 04G 一 0,1) ,得 方程 组 


58 
1 
8 六 二 + 六 和 - 交 3 
mm 全 加 AS ;之 ; 
8 0 2 和 -六 于 
Ap ,THOm 一 TrXTnLED 上 人 一 于 LI nn 一 
只 册 由 人 尾 有 下， 和 何 / 员 人 了 取 /外 -一休 DAN 大: 
他 ] 《7 了. 6 ) 
记 一 亲 一 7 一 和) 
1Ls 


一 -一 一 一 (0 一 0205) (7， 7.) 
L173 2 


7 2 


让 一 2 本 ， 有一 7 了， 二 2 村， 
] 了 1 也 “ ] 也; 


1 2 
加 权 最 小 二 乘 估计 是 基于 什么 思想 导出 的 呢 ? 本 来 应 用 


力 (Zi;) ii 


一 一 作为 二 一 的 估计 ,为 了 避免 分 子 和 分 母 出 现 零 , 所 以 用 
72; 一 7 力 ( 工 ; ) 


六 ;十 0. 5 力 (2 并; ) 


二 7 二 55 作为 1 二 50 的 估计 . 可 以 证 明 ( 基 于 概率 论 中 的 极 


N 人 (nj 2 ] ， 让 )， 


里 
(zij (zi)(1 一 六 zi))) 自然 想到 用 LU/; 佑 了 Ai (vi 的 定义 见 
《7.5)). 利用 (7. 2) 得 
2 一 记 十 Bi 十 e: (一 1]，…… 771). 


注意 UI 9，” ”9 mn 不 一 定 相等 . 令 2 一 了 Ee， (一 1，…，7). 则 











这 个 平方 和 就 是 上 文 的 Ga 人 因而 使 用 加 权 最 小 二 乘 估计 是 
有 道理 的 . 
例 7.1( 社 会 调查 ) 一 个 人 在 家 是 否 害 必 生 人 来 ? 我 们 研究 
人 的 文化 程度 对 此 问题 的 影响 . 因 变 最 
11， 害 怕 
0， 不 害怕 
自 变 量 zx 是 文化 程度 ， 取 '4 个 可 能 的 值 ， ZzlyZyyz3ayZi， 这 里 
Zi 一 0 表示 文 育 ,zz 一 1 表示 小 学 文化 程度 ,zs 一” 表示 中 学 
文化 程度 ,zi 一 3 表示 大 专 以 上 文化 程度 . 
`、 根据 某 地 的 一 项 社会 调查 报告 ,有 下 列 数 据 : 4 


. 自 变量 (z) 不 害怕 (Y=0) 人 数 害怕 (Y 一 1) 人 数 


0 1 7 
] 45 1: 32 
2 004 422 
3 168 72 


我 们 可 用 逻辑 斯 详 (logistic) 回归 模型 对 上 述 数 据 进行 统计 
分 析 . 用 (CCz) 表 示 一 个 人 文化 程度 是 工时 害怕 生 人 的 概率 , 即 


(Zz) 一 PCY 一 1|z). 考虑 模型 
力 (Z) 
in ] 一 力 ( 工 ) 记 证 Pi 7， 
我 们 用 加 权 最 小 二 乘法 估计 记 ,p. 
根据 上 列 数 握 ,利用 (7.4) 和 (7.5) 可 算出 zx 一 一 0.384 7， 


z; 一 一 0. 326 9,z: 天 一 0.451 5,z 三 一 0.842 5,m 一 0.219 9，m 一 
*。 204 。 





利用 (7. 6) 和 《7. 7? 可 得 到 广 0.013,8 = 一 0.25, 于 是 有 回 
归 方 程 
ln _&Sz) 一 0.013 一 0. 25z 
] 一 力 ( 工 
即 


Pry 二 11z) 一 expt0.013 一 0. 25Zj 
一 1 z) 一 TexpfD 013 一 0. 25z)} 


《1 工 1 FF 十 昌 - 忆 ~ 


由 此 知 ,一 个 人 文化 程度 越 高 ,害怕 生 人 的 概率 越 低 . 
义 上 只 对 一 个 自 变 量 的 逻辑 斯 请 回归 作 了 初步 介绍 . 看 要 .了 


解 更 多 的 知识 ,请 看 张 尧 庭 编著 的 《定性 资料 的 统计 分 析 一 书 ( 广 





1 证 明定 理 2. 1 中 的 最 小 二 乘 估计 量 吾 还 可 以 写成 以 下 三 种 形式 ， 


> 一 思 工 yy 
3 人》 
(GD 5= 忆 
六 一 史 瑟 ? 
> (zi 一 亏 )y 
(2) 5= 所 
> (Zi; 一 元 ): 
> zi(Cy 一 习 ) 
(3) 0= 过: 


ID 诈 ， 万 尖 -元 人 外 II 有 有 尖 mp 的 有 是 小 一 一 佬 计 让， 一 ”十 万 了 7 一 
2 AU 汪汪 后 门厅 和 CI0 8 卫 / 修 - 一 ZI YL CC Ti9 
1 ,2， ,7 证明 
开 


> Zi(y 一 yy) 一 0 


1 一 ] 
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3. 设 对 同一 组 点 (zy )， 一 1*2,…,2 分 别 用 最 小 二 乘法 拟 合 一 次 
> 天 4 十 pz 和 二 次 式 > 三 由 十 8 z 十 访 z ,说 明 为 什么 二 次 式 拟 合 的 残 差 平方 
不 会 大 于 一 次 式 拟 合 的 残 差 平方 和 . 

4. 为 了 考察 维尼 伦 纤维 的 耐 热 水 性 能 ,需要 探讨 甲醛 浓度 (g/L) 对 指标 
“ 缩 醛 化 度 ”( 克 分 子 %) 的 影响 . 安排 了 一 批 试 验 ,得 数据 如 下 : 

甲醛 浓度 z 18 20 22 24 26 28 30 
缩 醛 化 度 y 26.86 28.35 .28.75 28.87 29%.75 30.00 30.36 
从 经 验 和 理论 知 二 者 的 关系 是 近似 线性 的 , 即 有 

y 一 所 十 8 zz 十 e 


翅 省 


试 找 出 羽 , 的 最 小 二 乘 估计 ,并 菌 出 原始 数据 及 回归 直线 的 图 消 
5. 设 
嫉 一 Q 十 el 
% :一 2a 一 0 十 2 
ya 一 十 25 二 ee 


其 中 a 和 0 是 未 知 参数 ,el ,ez ,es 相互 独立 且 Eu 一 0,Var(e) 一 (2 一 1，,2， 
3). 试 求 出 ac 的 最 小 二 乘 估 计 . 
和 一 及 十 Ti 十 记 (3 了 一 2) 十 ee (二 1,2,3) 

其 中 zzz zs 已 知 ,& ,8 ,9 是 未 知 参 数 ,wm，y ，y 是 观测 值 ,el ,ez ,es 两 两 
不 相关 ,FEe 0,VarCe ) 一 z (一 1,2,3).， 试 求 出 让,p6, 记 的 最 小 二 乘 
估计 . 

7. 某 医院 用 光电 比 色 计 检 验 屎 示 时 ,得 到 的 屎 未 含量 (mg/L) 与 消光 系 
数 读数 的 结果 如 下 : 


尿 来 含量 z 2 4 6 8 10 
消光 系数 y 64 138 205 285 ， 360 
9 
假定 了 与 忆 有 记 41 以 并 人 伍 大 人 不 
y 一 所 十 岂 Z 十 e 
名 灌溉 | 轩 且 首 立 的 日 om NIO 2 汪 求 中 AR AR 的 是 外 一 还 仁 计 并 枪 玲 AQ 
人 和 UN 旦 让 Ed YY35O 7 UN 和 LU PR- 一 AI 4 过- 广 | 


是 否 为 零 ( 检 验 水 平 取 0. 05)，. 
8. 下 表 中 列 出 了 二 和 y 的 两 个 样本 的 均值 .标准 差 和 相关 系数 ， 


样本 ”样本 量 ”> 元 
。 200 。 


心 | 
L 
N 
[7 
cc 


] 600 9 12 l 3 0. 0 


分 有 
如 十 We 


试 计 算 两 个 样本 合 在 一 起 后 z 与 y 之 间 的 样本 相关 系数 ,并 说 明 这 个 相关 系 
数 小 于 原来 任何 一 个 样本 的 相关 系数 . 

9. 下 表 是 20 世纪 60 年 代 美国 洲际 弹道 导弹 数 的 增长 概况 : 
年 工 60 61 .62 63 64 65 .66 .67 68 69 


导弹 数 y 18 63 29%4 424 834 854 904 1054 1054 1054 


用 逻辑 斯 请 模型 y 王 L/(CI 十 ee) 拟 合 这 些 数据 , 取 工 王 1 060. 画 出 原始 数 
据 与 拟 合 曲线 的 图 形 . 
10. 设 随 机 向 量 Y 一 NCX8,oz) ,其 中 巷 


试 号 出 Y 的 密度 函数 并 求 出 得 到 YY 的 观 涡 


fs、 
1 HTY7T。 


| 
人 C 
CD 


六 六 
WU AU 


中 汪 


和 的 六 少 和 矩阵 (2 之 户 )， 


参数 8 与 co 的 最 大 似 然 


村 


12. 设 X 是 zzX 户 矩阵 ,Rank(X) 一 六 ,又 Py 一 XCXX)-X ， 试 证 明 下 
列 绪论 : 
(1) 半 维 列 网 量 > 在 子 空间 Aw(X) 上 的 投影 6 一 Pxy， 
(2) 记 Px 一 (AD)xnw， 则 
0 委 / 委 1 (一 
(3) 如 有 果 开 的 第 一 列 元 素 全 是 1, 则 


Ai 之 一 (一 1,2，……，77) 


。y 17 ) 


ii 
\ 


吕 | 一 


(2) w(CX'X) 一 ACX 
(3) (XX)CXX)-X 一 X ,其 中 (XXX)- 是 XXX 的 广义 赣 . 
(4) 7 维 列 向 量 > 在 子 空间 w(X) 的 投影 6 一 XCXX)- X >. 
(5) 为 了 8 是 方程 
。 267 。 


/ CR 一 允 
一 人 外 


4 7 列 向 量 上 人 一 个 AT 


(> 为 丈 维 列 回 量 ) 的 解 ,必须 且 只 须 
有 一 (XX)-Xy 十 ( 厂 一 (XX)- (XXD))u 
其 中 x 为 任意 的 户 维 列 向 量 . 
14. 考虑 约束 线性 模型 
[人 
LA40=0 
人 秩 为 ~ 证 明 2 的 约束 最 小 二 乘 估计 为 
一 [1 一 AAA -1AY 
5 考点 约束 级 性 村 到 
半 一 入 p 十 e 
请 地 
其 中 X 为 满 秩 2 义 迟 矩阵 (> 加 ) ,五 为 满 秩 gXzbp 和 矩阵 (Co<z), 则 8 的 约束 最 
小 一 乘 估计 有 表达 式 


六 方 1 rr 上 N\ 一 1LTYTAFTT /AN\ 一 1] TT/ 一 17 _- _  TT 广 
8 一 8 十 (有 及) 《了 | 了 太太 ) 《了 | 7 IT 


其 中 8 一 (XXX)-1IX'Y 为 无 的 束 的 普通 最 小 一 乘 估计 
16. 在 药物 的 临床 研究 中 ,病人 对 新 药 B 的 反应 > 与 其 对 标准 药物 A 


> 一 了 Tz 一 上 一 伺 4 一 IT PIT 了 Ai 7 -一 


的 反应 zi 及 病人 的 心率 zx 有 关 , 下 表 为 观测 到 的 10 组 数据 : 


| 
Se 


z 19 08 11 01 -0144 4.6 16 5.5 3.4 

Za 66 62 64 61 63 70 .68 62 68 66 

> 0.7 一 1.0 一 0.2 一 1.2 -0.1 3.4 0.0 0.8 3.7 2.0 
拟 合 > 对 zi,zs 的 线性 回归 式 y 一 十 Bi zl 十 房 Za 并 估计 误 差 方差 o . 

17. 访 


一 序 十 Bi 十 ef， 一 1 2，…，7 
其 中 El1 ?CE2 9 ”” ”9 Cn 独立 同 NO0O,o) 分 布 (ca 未 知 )y* 设 p , 永 为 色 ) 应 的 最 小 二 
乘 估 计 ，, 试 证 明 


2 


阿 (， 一 元 7) 
:一 1 


六 
"ec 了 


Var(B ) 一 


Var(pB ) 二 


。 Z05 。 


寺 1 : 记 一 0. 用 的 统计 最 并 说 
18. 对 第 7 题 检 验 球 :A _0( 水 平 oo 
19. 许多 人 认为 人 的 寿命 与 手掌 上 的 生命 线 长 度 有 线性 关系 ,下 面 的 50 


= 有 呈 本 Ye 一 


2 


不 


对 观测 值 是 否 支持 了 这 种 想法 ? 其 中 z 为 寿命 (年 ),y 为 左手 掌上 生命 线 的 
长 度 C(cm). 


z I19 40 42 42 47 49 50 54 56 56 
yy 9.75 9.00 9.60 9:75 ]1.25 9.45 11.25 9.00 7.95 12.00 
zz 57 57 58 -61 .62 62 .65 65 65 66 
》 8.10 10.20 8.55 7.20 7.95 8.85 8.25.…8.85 9%.75 8.85 
zx 466 166 67 68 68 68 69 69 70 7l 
y 9.15 10.20 9.15 7.95 8.85 9.00 7.80 10.05 10.50 9.15 
工 71 71 72 73 74 74 75 75 ，75 76 
yy 9.45 9.45 9.45 8.10 8.85 9.60 6.45 9.75 10.20 6.00 
z 77 8 8 2 83 8 8 8 94 


7 0 2 -82 .8 6 

y 8.85 9.00 9.75 10.65 13.20 7.95 7.95 9.15 9.75 9.00 
统计 量 2Z 三 3 333, 2 也 一 231 933，2 zy 一 30 549. 75, 几 9 一 459. 9，2 YY 一 
4 308. 57. 


合金 的 膨胀 系数 > 之 间 的 关 鼻 了 一 批 试 验 得 数据 如 下 
并 37.0 37.5 38.0 38.5 39.0 39.5 40.0 40.5 
多 3.40 3.00 -3.00 3.27 2.10 1.83 1.53 1.70 


》，1.80 1.90 2.35 2.54 2.90 


画 出 数据 的 散 点 图 , 问 > 与 z 之 间 是 否 有 相关 关系 ,如 有 , 则 求 出 经 验 公 式 . 

21. 炼 钢 基 本 上 是 个 氧化 脱 碳 的 过 程 , 钢 液 原来 的 含 碳 量 的 多 少 直 接 影 
啊 到 冶炼 时 间 的 长 短 . 下 表 是 某 种 平 炉 34 炉 的 熔 毕 碳 ( 即 全 部 炉料 熔化 完 
毕 时 钢 液 的 含 碳 量 ) 与 精炼 时 间 ( 从 熔 毕 到 出 钢 所 需 的 时 间 )， 用 z 表 示 熔 毕 
碳 (单位 :0. 01%%),y 表示 精炼 时 间 ( 分 ). 试问 :y 与 z 是 否 有 线性 相关 关系 ? 
若 有 ,请 找 出 回归 方程 . 若 测 得 某 炉 熔 毕 碳 为 145( 即 1. 45%), 试 估计 该 炉 
所 需 的 精炼 时 间 ( 置 信和 度 95 % ). 如 果 想 控制 炼 钢 时 间 在 240 分 以 下 ,95%% 置 
信和 度 下 熔 毕 碳 不 能 高 于 多 少 ? 站 


。 209 





2 104 100 19 | 123 110 
3 134 135 20 151 180 
4 141 125 | 21 110 130 
5 204 235 22 108 110 
6 150 170 23 158 130 
7 121 125 | 24 107 115 
8 151 135 25 180 240 
9 147 155 26 127 135 
10 145 165 | 27 115 120 
11 141 135 | 28、 191 205 
12 144 160 | 29 190 220 
13 190 190 30 153 145 
14 190 210 31 155 160 
15 ft61 - 145 32 177 185 


22， 回归 分 析 常 用 在 两 个 量 .y,z 密切 相关 而 其 中 一 个 (比如 y) 难 以 测 
量 时 ,用 测量 另 一 变量 (z) 来 估计 此 变量 (y) 的 值 . 比如 ,测量 不 规则 物体 的 
体积 可 能 十 分 困难 ,而 称 其 重量 却 很 容易 -下 表 为 5 到 8 岁 的 18` 个 小 孩 的 
体重 z(kg) 与 体积 y(dms ) 的 数据 ::- 


区 17.1 10.5 13.8 15.7 11.9 10.4 15. 


已 7 
| 一 
ee 
一 >) 
mm 
o] 
OO 


y 16.7 10.4 13.5 15.7 11.6 10.2 14， 


9 
工 1]5.8 lo.1 12.1 18.4 17.1.16.7/ 16.5 15.1 15.1 


多 


y ]o.4 14.8 11.9 1 


列 = 本 站 < 全 呈 2 


(1) 画 出 数据 的 散 点 图 并 拟 合 回归 直线 > 一 <a 十 pz. 
。270 。 


3 16.7 16.6 15.9 15.1 .14.5 


了 5% 置 信 区 间 . 

(3 0 kg 的 小 孩 的 体积 的 95%% 预 测 区 间 . 

和 23、 某 公 刘 了 推销 商品 ,研究 广告 费用 z 反 获 得 的 纯利 润 y 之 间 的 关 
系 ;以 确定 最 佳 的 广告 策略 . 调查 以 往 的 情况 ,有 以 下 数据 ;. 


并 1 1 2 2 2 3 
y 14. 80 15. 90 20. 20 20. 00 18. 59 24. 20 
并 3 4 四 4 5 9 
y 20. 90 21. 00 18. 30 20. 70 16. 10 14. 7o 


(1) 画 出 数据 的 散 点 图 , 试 找 出 y 对 .z 的 适当 的 相关 关系 式 ( 研 究 > 对 
z 的 一 次 式 、 二 次 式 , 三 次 式 并 比较 其 优 劣 ).…、 
(2) 最 好 的 广告 策略 是 什么 ? 
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8$1 全 面试 验 的 方 老 分析 


试验 设计 和 方差 分 析 是 数理 统计 学 的 两 个 重要 组 成 部 分 . 

在 工农 业 生产 和 科学 试验 (或 叫 实验 ) 中 常常 要 通过 试验 研究 
若干 个 因素 对 一 个 (或 多 个 ) 指 标的 影响 . 

例 1.1 烟灰 砖 试验 . 


其 建筑 材料 研究 所 为 了 芙 彻 “ 综 合 利 用 ”的 精神 有 下 庆 
不 四 坟 人 例 放 人 邢 下 和 页 例 环 有 人 JJ 交 有 人 全 荆 直人/ 民 


料 一 一 烟灰 来 做 砖 . 想 通过 试验 摸索 好 的 生产 工艺 以 保证 烟灰 砖 的 
质量 合乎 要 求 . 质量 指标 是 折断 力 , 它 可 用 每 平方 厘米 多 少 千 殉 来 表 
示 . 折断 力 越 大 越 好 . 试验 的 目的 就 是 想 寻求 提高 折断 力 的 新 工艺 . 
在 烟灰 砖 的 生产 中 ,成 型 水 分 的 多 少 、 碾 压 时 间 的 长 短 、 每 次 
算 压 时 投 多 少 料 都 可 能 对 折断 力 有 影响 . 成 型 水 分 .万 压 时 间 一 
次 碾 压 料 重 通常 称 为 因素 ,以 下 分 别 用 人 4,B,C 记 之 . 对 成 型 水 
分 ,要 比较 三 个 条 件 9 名 ,104% ,11 丸 究竟 哪 一 个 好 ? 对 研 压 时 间 
也 要 比较 三 个 条 件 8 分 ,10 分 ,12 分 究竟 哪 一 个 好 ? 对 一 次 算 压 
的 料 重 ,也 要 比较 三 个 条 件 330 kg，360 kg，400 kg 究竟 哪 一 个 
好 ? 每 个 因素 要 比较 的 各 个 条 件 称 为 因素 的 水 平 (或 叫 位 极 ). 在 
这 个 例子 中 共有 三 个 因素 ,每 个 因素 有 三 个 水 平 . 可 列表 如 下 : 


一 TI 
成 型 水 分 碾 压 时 间 一 次 碌 压 料 重 





1 水 平 9 % 8 分 330 kg 
2 水 平 10 听 10 分 360 kg 


3 水 平 110% 12 分 400 kg 
es。 272 。 


通过 试验 ;希望 回答 直列 三 个 问题 .: - 


An AF 一 天 一 全 


和 iemeeatt 


(1) 对 指标 [折断 力 7 的 影响 ,哪个 因素 重要 , 哪 了 | 因素 不 
重要 ? . 
(2)- 每 个 因素 中 郧 个 水 平 最 好 ? 


LQ2 名 有 玉生 由 人 佬 耕作 水 亚 抠 本 要 于 拉 起 昌 右 天 |? 
vv7L 人 同人 ER 招 R 有 个 人 日 下 月 个 ， 


这 是 多 因素 试验 中 比较 典型 的 几 个 问题 . 当然 ,在 实际 工作 
中 因素 不 必 限 于 三 个 ,各 因素 的 水 平 个 数 不 必 相等 怎样 安排 试 
验 ?' 如 果 各 因素 的 所 有 水 平 组 合 (在 例 1. 1 中 水 平 组 合共 有 27 
种 ) 都 进行 试验 , 则 叫做 全 面试 验 . 在 实际 工作 中 对 于 因素 个 数 较 
纱 ( 例 如 单 因素 或 两 因素 ?的 试验 常 采用 全 面试 验 . 当 因 素 较 多 
冉 ,全 面试 验 用 得 很 少 , 因 为 工作 量 太 大 ,试验 费用 太 高 . 有 冉 由 于 
试验 物资 的 限制 ,根本 不 可 能 进行 全 面试 验 . 一 个 重要 问题 是 ,如 
啊 选 出 一 部 分 有 代表 性 的 水 平 组 合 来 进行 试验 ? 这 就 是 试验 设计 
间 题 . 本 章 从 2 起 要 论述 试验 设计 的 方法 . 本 节 只 讨论 全 面试 
验 下 的 数据 分 析 ,着 重 介 绍 方差 分 析 法 . 


首先 讲 单 因 素 试 验 . 


所 谓 单 因 素 试 验 ( 也 叫 单 因素 比较 试验 )， 就 是 在 试验 中 只 


= 了 1 人 下 1 -一 


考虑 一 个 因素 ， 试验 的 目的 在 于 比较 因素 各 允 平 上 指标 值 的 
差别 . 

例 1.2( 
所 根据 我 
外 用 鱼粉 做 鸡 饲料 的 办 法 ， 他 们 研究 了 三 种 饲料 配方 :第 一 


乡 

-AL 

Rh 闪 鱼 汾 上 让 人 启 交 .和 钱 一 种 由 帮 检 洲 直 赵 娄 十 必 7 

和 神 , 以 鱼 狗 的 六 癌 竺 5 宙 二 和 神 以 愧 枫 稻 、 关 局 已 .杂工 HNUH 一 

重 但 粉 第 
电 

种 是 他 


饲料 对 比试 验 ) 册 为 发 展 我 国 机 械 化 养 鸡 ; 某 研 
国 的 资源 情况 4 十 缀 用 株 树 粉 划 蒋 粉 等 原料 代 芙 


VAN UV TID? 了 7 BA LEPFA Lv YY 1 LA JOAN TT  A 人 


为 主 
第 三 种 ,以 槐 树 粉 、 利生 次 为 主 加 分 量化 全 殉国 后 两 
也 人 


门 研制 的 新 配 比较 三 种 饲料 在 辩 鸡 增 肥 上 的 效 
门 研制 的 新 配方 . 为 比较 三 种 饲料 在 养 鸡 增 月 -MX 人 


,各 咀 养 10 只 母 稚 鸡 , 于 60 天 后 观测 它们 的 重量 . 基 下 才 
所 示 ， 
中 本 例 取 自 [7] 的 第 157 页 .  : 
,@ OA73 @ 


饲料 鸡 重 (Cg) 

第 一 种 |1073 1058 1071 1037 1066 1026 1053 1049 1065 1051 

第 二 种 |1016 1058 1038 1042 1020 1045 1044 1061 1034 1049 
种 


第 三 | 1 084 1 069 1106 1078 1075 109%0 1079 1094 1111 1092 


0 天 的 鸡 重 ， FEI 洪 上 自 . AIy -Ho 一 个 水 
AN 月 JA 人 人 9 | 为 人 大 J1T9 AN 一 /外 


三 种 饲料 在 养 鸡 增 肥 的 效果 上 有 何 差 


在 这 项 试验 中 , 抬 标 用 
HL 过 -入 PN JJ 日 小 小 全 


平 . 试验 的 目的 是 要 比 
别 . 这 是 单 因 素 试 验 ，, 
如 何 进 行 比较 呢 ? 如 果 不 存在 试验 “误差 ?, 那 很 简单 . 只 要 
对 每 种 饲料 养 一 只 雏鸡 ,在 60 天 后 称 一 下 重量 就 是 了 . 然而 ,由 
于 鸡 与 鸡 之 间 的 个 体 差别 造成 较 大 的 误差 , 故 所 观察 到 的 数据 并 
不 能 完全 反映 饲料 的 结果 . 自然 想到 比较 各 种 饲料 下 的 平均 鸡 
重 , 从 表 中 可 算出 :第 一 种 饲料 下 平均 鸡 重 为 1 055 g, 第 二 种 饲料 
下 平均 鸡 重 1 041 g, 第 三 种 饲料 下 的 平均 鸡 重 为 1 088 g. 从 直观 
上 看 ,三 种 饲料 在 增 肥效 果 上 有 了 明显 差异 ,而 且 第 三 种 饲料 好 . 细 
心 的 读者 会 问 : 怎 么 知道 三 个 平均 数 之 间 的 差异 主要 由 于 饲料 不 


mLnT ir 中 YIZ 二 光 ( 
同 产 生 而 不 是 由 于 试验 误差 所 造成 ? 换 句 话说 ,如 何 鉴别 平均 数 


的 差异 主要 来 目 " 因 素 ” ,还 是 主要 来 目 误差 ”? 


Ya ET 了 | mr 了 上 ADD 一 AAA -ar 一 > ww 一 = -Ze 人 -一 


这 需要 一 种 新 的 统计 分 析 方 法 一 一 方差 分 析 . 
先进 行 一 般 性 讨论 ,然后 再 回 到 例 1. 2 上 去 . 
只 考虑 一 个 因素 4A, 有 * 个 水 平 :4 ,4,，…A4,(2), 问 :这 
些 水 平 对 指标 y 的 作用 是 否 一 样 ? 


.AT/ 1 人 一 王 


设 4A,; 水 平 下 重复 进行 了 > 次 试验 (Cr 之 2) ,数据 是 yiyyi2y” 


我 们 假定 有 下 列 模型 


Jr 区 和 丰 诅 1 ”JJ LA 


人 
WU 


5 一 Ai 十 6 (一 1]，…，5; 7 一 ，……，7) (人 1. 1] ) 
讨 rHH nt 有 ~ NAnNO 2 二 站 rn 
AS Ti 1 一 -9 二 Li) VANV3O /909O 个 人 H。 
已 4 : :LI 一 Ap 一 ”一 ALL (1. 2) 


要 第 四 章 中 已 有 一 般 理 论 ， 


现在 要 用 到 互 * 的 检验 上 来 . ? 
。 274 。 























f ] ell ] 
E=-| .| ，e=| 
1 | 国 
易 知 模型 (1. 1) 可 写成 
| pa] 
YY 一 广 | : 上 +。 
| 


设 [LI 9 ”9 HLLs 的 最 小 二 乘 佑 计 是 A 9 ”9 //， , 则 有 残 差 平方 和 


Am @ SA 们 v ” AN 少 
人 4 一 min yi 一 


必 


FF 一 Qa 一 Q)L4s 一 了 FG 一 1， SCr 一 工 )) 
(CUL/ 人 /7 一 3) 
故 可 用 统计 量 下 检验 假设 互 4. 
我 们 指出 有 下 列 简单 公式 ， 
Q. 一 Q=r2> (yi 一 y; 


t 


其 中 
275 ， 





2 

实际 上 ， 

六 (1 一 和 一 之 ( 攻 一 因 天 十 COe 一 人 

下 1 ij 1 

Q= 六 (3 一 y): 
由 于 
六 (3 一 A) 一 2 一 3y)2 十 过 (7y 一 Ai 
易 知 一 


Qi 一 二 2 5 一 入 证 
于 是 
Qa 一 Q 王 ri 一 2 
所 以 检验 互 。 的 统计 量 是 
7 之 (0 ee 


(《 ] 3) 是 很 重要 的 平方 和 分 解 公 起 抬 个 平方 和 分 解 为 两 
十 信里 妇 则 玉 刀 和 胡 公 基 ， 蕊 蕊 一 人 二 力 入 丰 朋 订 网 


个 平方 和 , 每 个 平方 和 痢 有 明确 的 直观 意义 :(1. 3) 却 的 左 闯 万 是 
全 部 原始 数据 围绕 平均 值 产 生 的 波动 平方 和 ,而 (1. 3) 式 右 端 第 一 
项 表示 由 于 试验 误差 引起 的 波动 平方 和 (同一 水 平 下 数据 引 起 的 


相 ai YY na aa 


波动 平方 和 ) , 右 喘 第 二 项 是 数据 由 于 因素 的 不 同 水 平 而 引起 的 该 
动 平方 和 . 很 明显 , 若 (1. 3) 式 右 端 第 一 项 比 起 第 二 项 大 得 多 , 则 


LA Te TU AL > -1 A mm” TU 下 AAA 0 


说 明 因 紊 的 各 水 平 对 指标 的 影响 无 显著 差异 ,反之 ,在 第 二 项 比 第 
一 项 大 得 多 , 则 说 明 因 素 的 作用 很 大 ， 各 水 平 的 影响 有 显著 差异 . 
这 就 给 出 了 上 述 用 统计 量 下 进行 检验 的 直观 意义 ， 
把 全 部 原始 数据 产生 的 波动 平方 和 分 解 成 看 干 个 有 特定 意义 
。 2Z70 。 


三 


和 (其 中 有 一 个 与. 
Ph、S 1 


中 | 人 性 


训 


方差 分 析 有 R A Ich 王 


1 4AFE 人 有 目 ( 人 HEHH 十 
全 - 几 有 | 9 E N。 人 和 。 Fisher J 工 三 | 


已 JHNHJ。 1TL FF 户 人 1? 


常用 方差 分 析 表 的 格式 . 单 因素 情形 下 的 一 元 方差 分 析 表 如 下 : 


方差 来 源 显著 性 
S4/(S 一 工 ) 
S。. /SCr 一 并 ) 


SA 一 r27 (和 一 光 ) SS 一] 

















现在 将 上 述 _- 般 性 理论 用 到 例 1. 2 上 去 ,得 下 列 方差 分 析 表 


11 675 和 | - 28. 34 兴 关 
误 5 569 


we 





由 此 可 见 , 因 素 是 显著 的 , 即 不 同 饲 料 在 增 肥 效果 上 确 有 闭 


人 r- 评 FE 是 Ni， 下 mA 间 站。 本 有 ee  。、 -ae 二 


别 . 既然 第 三 种 饲料 下 的 平均 鸡 重 高 于 第 一 种 和 第 二 种 饲料 下 的 
平均 鸡 重 , 故 第 三 种 饲料 增 肥效 果 最 好 下 


1 站 下 全 生生 


由 妆 假 设 (1. 2) 被 拒绝 ( 即 因素 A 是 显著 的 ) 时 ,只 表明 pi,…，/ps 不 全 相等 ,并 
未 指明 某 个 m 与 某 个 如 相等 与 否 . 若 要 进一步 判别 必 与 六 相等 与 否 , 则 需要 学 习 统 
计 学 中 的 “多 重 比 较 的 方法 ”( 见 174 的 第 五 章 ). 本 书 不 介绍 这 些 比较 次 和 人 的 内 容 . 

LAIA 。 


还 需 指出 的 是 ,在 单 因素 试验 中 ,各 水 平 下 的 试验 次 数 不 必 相 
等 利用 线性 模型 的 理论 也 可 导出 相应 的 统计 量 与 方差 分 析 公 
二 留 热 尘 必 估 交 统 习 
一 AN FI -站 全 1IF 一 个 ”~ 

可 在 来 重生 和 人 素 的 于 办 | 

ImL DEI 在 人 、-[L YI A 有 PE 滞 姜 -AAA -vv AN 疙 

以 培 杀 人 4 有 ss 个 小 -人 :人 1 9 人 问 乏 忆 人 信人 小 :19， 


B,(s2，:2)， 对 所 有 的 水 平 组 合 都 进行 了 > 次 试验 (r2)， 设 
4 处 于 : 水 平 处 于 7 水 平 下 指标 的 理论 值 是 由 ,观测 值 是 .yz1， 


.see 4) 樟 刑 | 具 . 
.yi2 9 .Jijr 9 天 二 年: 


yi 一 人 十 CE; 〈]. 4) 

(7 一 )。。 5 ; 7 一 ]，……，; R 一 1] 7) 
其 中 {ex } 是 试验 误差 ,我 们 假定 它们 独立 同 分 布 , 且 如 一 N 
(0 ) (Ca 未 知 ). 


关子 人 分析 各 因 妻 对 指标 的 影响 人 
心 于 万 氏 合 内 条 阅 拓 性 有 吕 网 。 们 
一 工 S 
玫 人 
一 SN 一 (了 一 -1 
0 一 了 局 一 人 3 
] 一 1 
1 区 
人 广 二 下 Ai 二 人 《7 一 1 ) 
i 一 1 
4 /一 上 一 一 局 
则 
同一 wp 十 w 十 局 十 妈 。 (1.5) 
27w 一 28- 2- 之 /5 一 0 (1.6) 
;一 1 


厅 难 千 由 圭一 人 we 人 入 由 涝 让 4 多 圭 二 有 PE 人 铬 
1 三 个 水 平 的 1 广 三 f 匡 三 二 < [JS - 考 时 融 7/ 


个 水 平 的 作用 … 通常 称 ui 为 水 平 A 的 主 效应 ,8; 为 水 平 B, 的 
主 效应 ,5 为 4, 与 了 下 的 交互 作用 效应 . 很 明显 , 奉 Ms 一 0( 一 切 
7) ,出 
/二 /十 皇 十 记 
"27V6 。 


这 表明 在 因素 4 的 A; 水 平 与 因素 B 的 Bi 水 平 下 的 理论 值 ( 址 
值 ) 可 表示 为 因素 A 与 因素 B 单个 “作用 ”的 到 加 . 若 15 半 0, 则 从 
(] SG 呈现 才 4 扩 老 玉 对 指标 的 综合 “作用 ”不 能 归结 为 单个 
Newv7 AH 9 | 一 为 《aa 一 | LA 人 JJ 日 HHJ 仆 吕 1 六 7 记 JJ ”已 一 上 AAA 
因素 作用 ”的 到 加 ,而 因素 间 有 一 种 内 在 的 联系 在 起 作用 (所 谓 交 
百 作 用)》， 
-十 产 7 7 
待 检验 的 假设 有 
万 : al 一 as 一 … 一 ay, 一 0 (1. 7) 
万 ，: 记 三 永 一 … 一 上 友 一 和 (1] . 8 ) 
万 3: : : 1 一 人 lz 一 … 一 人 一 0 《]】. 9 ) 


玉 的 含义 是 因素 4 没有 影响 , 互 : 的 含义 是 因 勾 妃 没 有 影 
啊 , 互 : 的 含义 是 :4 与 恕 的 交互 作用 不 存在 . 
先 用 线 性 模型 的 一 般 理论 导出 各 个 检验 统计 量 的 抽象 形式 ， 
然后 利用 平方 和 分 解 的 手段 找 出 统计 量 的 具体 表达 式 . 
将 {y 站 } 按 足 标的 字典 排列 法 写成 一 向 量 
J111 
一 52 | 


四 
Lur | 
记 6=EY，6E 可 用 参数 1 ip 5 表示 出 来 . 记 
允 王 {6: 参数 满足 (1.6)! 
允 7 一 人 46: 参数 满足 (1.6) 及 (1.7)} 
允 : 一 人 6: 参数 满足 (1.6) 及 (1.8))} 
W:= (8: 参数 满足 (1.6) 及 (1.9))} 
设 历 的 维 数 是 如, 柬 . 的 维 数 是 vc (= ,2 .3),Y 在 寻 


归 J 一 瑟 训 入 AEE LTY 1i 的 维 效 是 qi 二 9LC9JUI79L 1 TY 上 


人 AAA 
6 ,Y 在 矿 ， 上 之 投影 为 和 (一 ,2 3). 
全 门 一 lw _ ea 半 |2 人 往 一 lw _ all2 人 
rr 一 || 革 So | ， ti < Sil ， YY 立 


记 77 人 (7 一 str) 
从 第 四 章 知 , 厂 已 ， 成 立 , 则 | 了 ;一 了 (7 一 qi， 2 一 ?1), 故 可 用 统计 量 
。 29 。 


剩 下 的 问题 是 如 何 计算 17 yd19d2d3 及 CQ GQz ,Q:. 
TB 1 


九 X 力 算 陈 上 且 给 媳 | 县 若 窒 间 V 一 
仆 慷 上 目 PFAEP AH 入 2 网 星 ?和 有 二 胜 


=4z), 则 V 的 维 数 是 
证 明 : 用 反 证 法 易 知 A 的 各 列 线性 无 关 , 从 而 Y 的 维 数 是 刀 . 
证 毕 . 
由 于 厂 中 的 E 可 瞧 一 地 由 参数 wa ya 1 8 Bai 
15-1yA2，…A -1 一 1 表示 出 . 故 多 的 维 数 ， 
1 一 上 十 (一 1) 十 (人 一 1) 十 (一 ( 一 1 一 束 
WW 中 的 可 唯一 地 由 克 由 9 太一 1 "人 11 …A 人 ,1 表示 出 , 故 
4 一 1 十 位 一 1 十 (一 1 一 1) 一 区 一 (一 1) 
9 一 上 十 (一 ]1) 十 (一 1 一 二 一 让 一 (人 一 ]) 
允 : 中 的 拓 可 唯一 地 由 Awaya-l 8 8 表示 出 , 故 
9 一 1 十 4 一 1 十 人 一 ]1) 一 5? 十 上 一] 
剩 下 是 求 Q,Q,Q: ,Q:. 用 平方 和 分 解法 ,方法 十 分 初等 ,但 表达 
式 比 较 索 . 引进 下 列 记号 


(S: 存 在 x, 使 得 64x 中 的 每 个 向 量 的 表示 法 是 唯一 的 ( 即 对 任何 
俱 、， & 


- - 工 立 -了 工 癌 
Ji 一 人 人 人 39 请 才 
7 所 1 7 7 
了 本 
一 一 1 上 
一 一 一 人 
7 StL7- 这 Ai 
7 71， 
甘 人 记 呈 了 了 林 Ab 人 念 V 且 . 汪 个 | 不 歼 麻 
AT YL 了 狼 JJ 可 有 口 和 人 入 二 和 及 R 7 人 页 此 
S 一 、 (vv ， 一 一 Ci 一 ,一 人 ) 
LE ea 和 帮 
zy， 1 ,天 
_ 一 \2 -一 2 
一 >,[(y 关 一 yy ) 十 《yi 一 太一 ai 一 房 一 人 5) ] 
1 1 
NI __ 六 NIrri 二 D AN 
人 J 汪 Ji LN 了 六 人 i /下 
2 了， 天 7 大 
(y， 一 Qi) 于 


2，7 ,大 
四 7 N2 1 vv 一 一 一 一 一 1 ”一 。 AN\2 
四 yi .yy 5 1/ 了 下 5 ”Vi 4 了 yy 人 人 人 Ai/ 
1，7 ,大 2，71 
十 (一 一 8)2 十 \》 (JTJ 一 了 一 w)2 十 \、 (本 一 ，)? 
| 必 “ 六 LA/、v; - LA 天 
1 了， 天 1，] ，, 屎 
由 此 可 见 


CQ 一 人 >， 《yy 庆 一 y 了 ) 


Q:=Q 十 2 (7 一 忆 ): 

Q: 王 Q 十 之 (7 一 ): 

Q 一 Q 十 > ( 蕊 :一 太一 了 十 了 7 
于 是 


Sa 一 QQ 一 Q=r2>， (也 ,一 了)2 一 SA 一 Sa 


| 
[M 
一 
避 | 
| 
Se| 
| 
必 
十 
心 
习 
十 
[M 
人 
忆 
习 


1 1 大 


“。 2 。 


现在 玉 一 9 一 * 一 1，71 一 0 一 上 一 1，M 一 0 一 (一 1)(C 一 1)，272 一 
MM2 一 SC 一 1),， 故 有 计算 公式 
六 _- S,/(5 一 1) 
QI/ 人 Cr 一 1) 
书 Sa/( 一 1) 一 
Q/ 人 Cr 一 1) 
开 hxs/(3S 一 1)(t 一 工 ) 
Q/LX(Cr 一 工 ) 
一 一 -ee AN 二 一 二 二 -一 一 
同志 刀 人 外 不 2 人 : 











SaA/(s 一 1) 
已 9 上 一 Sas/(t 一 ]) 了 ， 
AX 吕 9aAxB (5 一 1)(t 一 虐 ) S4xp/1(S 一 1)(C 一 |) 


准 : | A 一 总 上 本 
YY 者 愉 罗 只 






4 十 98 十 9axs 十 Q= > (yy 二 一 也): 
等 式 右 端 常 记 为 Sr， 
例 1.3 在 某 橡 胶 配 方 中 , 考 虑 了 三 种 不 同 的 促进 剂 、 四 种 不 
同 分 量 的 氧化 锌 ,同样 的 配方 试验 两 次 , 测 得 了 300%% 的 定 强 
如 下 : 


一 一 


刀 : 氧 化 锌 
~ 定量 B， B， B， 忆 
A, 促 进攻、 人 人、 
A， 31 ,33 34 ,36 35 ,36 39 ,38 


A， 33 ,34 36 ,37 37,39 38,41 
37 ,38 


39 ,40 42 ,44 





问 :氧化 锌 ,促进 剂 以 及 它们 的 交互 作用 对 定 强 有 无 显著 影 
282 ， 





和 2 -AAA -YA 因 At 上 产 AD 1mDN 一 mm 个 了 AD 1DN\- 一 A 人 
{ 芋 已 轧 4 人 DJINITI 有 LAXEE 人 099N\C9 LI 一 Us vv 人 099N\D9 7- U。V，》 
Foss(6,12) 王 3.0, 故 4 B 都 是 高 度 显著 的 (用 * <* 表示 ),A 义 召 

一 妆 - 二 -由 + 上 Ta 《二 立 i 工 mT AGE 《Ti 上 nn 已 北 固 ES 由 人 TER 
驱 人 小 亚 有 J、 拓 网 ID 号 交 人 NT 评 逮 里 有 有 hh 赴 ' 于 女 昌 加 了 和， 的] 
者 相 比 氧化 锌 更 重要 一 些 . 这 两 个 因素 的 交互 作用 不 存在 ,相应 
上 < _ 了 - 工 一 盖 3 \ 口 ->e LA 工 1 一 一 nm 一 ri 、\ -os 工 一 -Am 人 、A 上 
虽 -人 /信人 六 和 下放 过 有 一 作风 蚊 了 这 有 有 付 : 从 和 区 去 水 有 拍 放 4 
应 的 自由 度 也 合并 ,以 提高 分 析 的 精 并 . 改进 后 的 方差 分 析 表 





因素 4、B 仍 是 高 度 显 著 的 . 


和 ss 关 一 六 


以 上 讨论 了 单 因素 和 两 因素 全 面试 瑞 分 术 ， 
法 可 推广 到 更 多 因素 的 全 面试 验 的 数据 分 析 上 去 ,由 于 公式 太 繁 ， 


使 用 价值 较 小 ,这 里 不 介绍 了 . 
8$82 多 因素 试验 设计 问题 的 提 法 与 数学 模型 


前 面 说 过 ,在 试验 工作 中 奉 要 考察 的 因素 较 少 ,可 采用 全 面试 
。 L53 。 


验 , 即 各 因素 的 所 有 水 平 组 合 都 安排 试验 ， 当 因素 较 多 时 ,这 种 全 
面试 验 就 不 合适 了 ,这 时 只 能 从 各 因素 的 所 有 水 平 组 合 中 挑选 有 
人 去 性 的 一 好 和 诬 征 评 和 怎样 挑 洗 上 2? 和 全- 釉 掉 涉 四 月 种 计 
| N ss 1- 有/ 有 | .AL NEC。 GAN FF 人 JU AL 。 三 于 1 JU LS 人 己 】 上 Jr 


验 设计 
二 > 7 下 Yar 人 下 -1 gm TB 人 1 有 HEH6 HI PTA NI HRn 站 FA 2 页 语 洲 和 二 
必 曙 放 已 且 ， 失 1 砷 七 J 扩 有 生生 性 汪 器 双 了 

模型 


假如 我 们 要 考察 mm 个 因素 下 , (有 ss 个 水 平 ) ,FE (有 s: 个 水 


平 )，…, 下 (有 。 个 水 平 ) 对 某 指 标 x 的 影响 . 用 1,2,……,s* 记 正 


>< 和 -了 到、 T 汪 1 “JJ /LA DNS EL ie 713 1 2， 9 世 L 


的 > ) 个 水 平 (5 之 2). 当 下 取水 和 平 AM1， 了 : 取水 平 人 2 上 取水 
平 M。 时 指标 a 的 真 值 ( 理 论 值 ) 为 asCi,hz,…，,hw), 注 意 真 值 
fa he) :1T 委 i 委 sm)} 共 有 se…sn 个 ,它们 是 
客观 存在 的 ,但 我 们 却 观察 不 到 . 我 们 能 观察 到 的 是 观察 值 


一 CC see 人 m) 十 eh ， 


.了 A (人 》 


这 里 e ， 是 随机 变量 ， ,均值 是 0, 般 假定 它 服 从 N(0,oz)， 如 何 
根据 观察 值 {y ..，} 来 估计 真 值 (hl ,…,h。) 或 研究 其 性 质 ,这 是 
很 重要 的 问题 

要 对 所 有 的 水 平 组 合 都 做 试验 取得 观察 值 , 那 代价 太 大 了 , 实 
际 工作 中 常常 不 允许 . 故 问 题 的 提 法 是 :从 所 有 的 msz…snw 个 组 
合 中 合理 地 尽量 少 地 挑选 一 部 分 组 合 做 试验 ,然后 利用 得 到 的 观 
察 值 推断 出 真 值 <(h; ，… ,how ) 的 值 或 性 质 ， 

真 值 函 数 有 些 什么 性 质 要 研究 呢 ? 引进 必要 的 定义 . 


…A 








关 1] Am ，、 、 
一 全 CQCAI 1Qm 
上 >， 扩 
-用 -有 _ 4 
和 1 
pr \、 1 、 


。 254 。 


[M 


人 es 和 和 二 = = 六， 入 ， 售 全 全 次 
1 $ A1 9 7 人 ;一 1 ?Ai 十 1 儿 ? j 一 1 他 | 晤 9 7 
4/ 


六 1 
记 (CAi) 一 万 (A) 一 所 
(< 71， Ai 一 ]，…，344 Ai 一 上 Si) 
当 ;7 时, 令 


访 ; (A; Ai) 一 (A， 人; ) 


称 记 为 试验 设计 问题 { 天 Fis sy 的 一 一 般 平 均 . 

BC) 叫做 因素 已 在 水 平 人 ;时 的 主 效 应 ,(p8 CD) :Ai 一 1，…， 
5 叫做 下; 的 主 效应 . 

| 在 水 平 人 因素 玉 在 水 平 人 时 交互 作用 效 

(8 一， 一 3) 叫做 天 与 天 ;的 交互 作 


用 效应 . 上 述 效应 (包括 一 般 平均 ) 共 有 1 十 si 十 … 十 sn 十 >》 5i5 
ti<<) 
个 ,都 是 试验 问题 本 身 固 有 的 ,与 试验 如 何 设计 无 关 . 
和 注 在 对 于 办 王 1,2,…，5S 及 和) 王 1, 2 5 。3) 个 值 pb， (Ai ) 不 全 相 
等 , 则 称 因 素 F 和 瑟 ) 间 有 交互 作用 ,也 说 玉 关 忆 存在. 相反 情形 〈 即 
(0 ) 王 const( 对 一 切 ws ,5 )), 则 称 已 与 Fi 间 无 交互 作用 ,也 说 已 X 已 
术 存 在 . 二 因素 间 交 互 作用 存在 的 直观 意义 是 :二 因素 对 指标 a 的 综合 影响 


不 等 于 各 因素 单独 影响 之 和 ,例如 ,在 农业 试验 中 考察 氮肥 (CN) 和 和 肥 (P) 


品 4 六 AR AAA 有 ”9 人 一 人 内 JJ AP 7 LA 十 记 NMN 可 “可 向 了 门 忆 、 1 RET AL 二 


对 大 豆 产 量 的 影响 氮肥 有 两 个 水 平 :Ni =0( 即 不 施加 氮肥 ),N: 一 6 斤 ( 每 


亩 施 j 扣 和 扎 肥 6 斤 中 ); 碟 肥 有 两 个 水 平 :Pi; 王 0( 即 不 施加 克 肥 ),P;: 王 4( 每 元 


和 NE 9 FT AU FS FT 人 人 田 AL 


加 4 斤 ). 两 个 因素 共有 四 个 水 平 组 合 . 在 土地 情况 大 体 相 同 的 四 块 试验 田 
上 种 大 豆 ,每 块 田 对 应 一 种 “水 平 组 合 ”, 即 一 种 施肥 方式 .例如 NiP， 对 应 


-LT AN 过 人 二 和 可 


的 施肥 方式 是 ,不 施 氮肥 ,只 施 磷 有 4 斤 / 亩 . 设 四 块 田 的 大 豆 再 产 如 下 ( 单 
位 : 斤 ) 


中 斤 为 非法 定 计 量 单位 ,1 斤 =500 g. 
。 285 。 


人 UP |  P=0 P, 一 4 
N 
N 一 0 400 450 


从 表 中 看 出 ,只 施 4 斤 碟 肥 , 大 豆 增 产 50 斤 ,这 反映 磷肥 的 作用 ;只 施 6 斤 氮 
肥 ,大 豆 增 产 30 斤 ,这 反映 了 和 氮肥 的 作用 ; 既 施 6 斤 氮肥 又 施 4 斤 磷肥 ,大 豆 
增产 了 160 斤 , 它 比 单独 的 磷肥 的 作用 与 单独 的 氮肥 作用 之 和 要 多 出 80 斤 ， 
这 体现 了 氮肥 与 磷肥 间 有 交互 作用 . 

类 似 地 ,我们 还 可 考虑 三 个 因素 间 的 交互 作用 ,四 个 因素 间 的 交互 作 
用 ,… 大 量 实 际 经 验 表 明 ,在 大 多 数 情 形 下 ,三 个 或 三 个 以 上 因素 间 的 交互 
作用 ( 称 为 高 级 交互 作用 ) 都 比较 小 ,可 以 忽略 . 甚至 某 些 二 因素 间 的 交互 作 
用 也 可 以 忽略 . 


要 注意 的 是 ,这 些 效 应 之 间 有 下 列 关 系 式 : 


2 (Ai 一 >,85 Ci ) 一 0 
下 独立 的 参数 个 数 等 于 


试验 工作 者 关心 下 列 一 一 个 或 几 个 问题 ， 
(1) 忆 是否 对 指标 ae 有 影响 , 即 问 玉 ; 的 主 效应 8 (是否 对 


_ 一 
切 人 ; 1 人 


(2) 天; 与 卫 ;是否 有 交互 作用 效应 , 即 问 8 CA ) 是 否 对 一 
切 作 ; ? 作 ; 一 样 大 ”? _ 
(3) 怎样 估计 出 BC ，B5 CD)? 


灵 中 未 一 了 


) 如 何 找 出 优良 的 水 平 组 合 C7 ,AMAz ，… 7 )， 下 ， 
国生 的 水 平和 2 的 水 平 1” 使 得 指标 a (AM ,027 


了， 和 了， 的 “ 另 “ 二 


1 ) 尽 可 能 的 大 (如 果 指 标 a 的 值 越 大 越 好 的 话 ) 或 尺 能 的 由 


《如 果 指 标 a 的 值 越 小 越 好 的 话 )? 优良 的 水 平 组 合 又 鸭 优 和 有 以 | 


AD HL 一 人 一 天 故人 ，。 JU IJ 有 JJ [JJ 器 入 AU RV 


工程 条 件 ( 或 称 生 产 条 件 ). 
286 ， 


上 
要 


实际 工作 中 (特别 是 工业 试验 ) 最 常 遇 到 
) 则 是 科学 研究 中 常见 的 , 旨 在 探讨 
) 


3 十 
对 指标 的 影 啊 规 律 ,认识 客观 事物 、 也 能 帮助 寻找 


-一 工 呈 名 /小 NT HA1TN NT Ha ODN 工 Th HE 7 人 人 ) ) 合 称 站 3 /A 十 挛 作 T 日 于 人 人、 
工程 条 件 . 回 帅 41) 、 加 帅 42) 可 问题 43) 合 栎 内 系 分 久 问 题 . 全 同 


优化 问题 与 因 聚 分 析 问 题 二 者 有 密切 联系 但 侧重 点 是 不 同 的 . 何 


1 


者 作为 试验 工作 者 的 首要 目标 ,对 选择 试验 方案 ( 即 试验 设计 ) 有 
恨 大 影响 . 

大 量 的 实际 工作 经 验 表 明 , 若 以 全 局 优化 问题 为 首要 目标 , 则 
在 制定 试验 方案 时 可 以 大 胆 忽略 因 际 间 的 交互 作用 ,同时 安排 较 
多 因素 进入 试验 ,采用 正 交 设计 或 均匀 设计 可 使 得 通过 较 少 的 试 
验 次 数 找 出 比较 优良 的 工程 条 件 . 〈 当 然 , 所 找到 的 “工程 条 件 " 一 
般 不 一 定 是 最 优 的 . ) 若 以 “因素 分 析 ” 为 首要 目标 , 则 在 制定 试验 


于 人 人 一 


方案 时 应 考虑 因素 间 的 交互 作用 ,特别 要 注意 某 些 二 因素 间 的 交 
互 作 用 可 能 存在 . 此 时 , 正 交 设计 仍 是 制定 试验 方案 的 重要 手段 . 

限于 篇 幅 ,我 们 重点 介绍 正 交 设计 的 某 些 基本 知识 . 至 于 均 
匀 设 计 , 可 参看 方 开 泰 著 《 均 匀 设 计 与 均匀 设计 表 》( 科 学 出 版 社 ， 
1994) 或 [20]. 


上 述 问 题 (4) 就 是 工程 上 的 最 优化 问题 ,简称 全 局 优化 上 问 
时 的 . 


硬 


$3 正 交 表 和 正 交 设计 
正 交 设 计 是 利用 一 些 特制 的 正 交 表 来 安排 试验 . 我 们 先 介绍 


中 正 交 设计 和 均匀 设计 都 是 特殊 的 试验 设计 . 试验 设计 的 一 般 定 义 可 如 下 统 
述 . 设 要 考虑 关 个 因素 下 ,Fz ,Fw 对 某 指 标的 影响 ,其 中 豆 有 si 个 水 平 , 分 别 用 
1,2……,si 来 表示 (7 =1,2,… ,mm) 所谓 一 个 “试验 设计 ”就 是 指明 王 个 因素 的 哪些 水 平 
组 合 要 做 试验 ,还 要 说 明 试 验 的 重复 次 数 . 换 铝 话说 ,对 每 个 水 平 组 合 (AhA2，…，Am ) 


二 7 。 上 LA。 fr JE 、 \ mm mm 1- 十 


规定 试验 的 重复 次 数 z(CAl ,2 ，… Mn)( 非 负 整 数 )， 当 zy 2，… An) 一 0 时 意味 着 相 
应 的 水 平 组 合 (Ai,Mz，…'Am) 不 进行 试验 ， 从 数学 上 看 ,一 个 试验 设计 (或 试验 方案 ) 就 
是 一 个 非 负 整 值 映射 CC。，…，。)， 大 7CA1 9 ””“” Am ) 委 1 , 则 称 试验 是 无 重复 的 . 


。 2 。 


设 m>2,53，…Sw 是 oa 个 不 小 于 2 的 正 整数 . 


AAA ErkERA .4A 一 AN 目 ww sw 弄 记 人 记 
正光 .1 称 赴 昕 和 和 人 An )xm 丰 31 人 久 32 从 入 Sm 年 上 人 信友 


(5 X…Xs)), 匣 它 满足 下 列 条 件 : 
(1 ) Ai 和 (1 2， ) Si (1 雪 ; 天 71， 1 委 7 魏 7M) - 
(2 ) 对 任何 / < 1 ZEG(L,2 3 IE (1 ,2 s 光 /有 





#{:(Ay ，hA ) 一 (yu) ) 一 
4 @ 4， 


J1 Jo2 


这 里 #A 表示 集合 A 的 元 素 个 数 . 当 5 王 % 三 … 一 sm 二 时, 正 交 
表 记 为 了 (和 )， 当 一 s 一 一 sm 二 3 时 正 交 表 记 为 世 ,(si 六 
Sm ). 

常用 的 正 交 表 有 革 , (23 ) , 工 。 (27) , 工 , (34) , 革 6(25 ) ,Li6(45 )， 
Lis(2X3 ),Lz (3 ) 等 ,下 面 介绍 已 (2 ),Ls (2 ) 和 工 *(3 ) ,其 余 























的 表 可 参看 [1] 和 [5]]. 
表 L.(2 ) 是 
仁 ] 1 
1 2 ?| 
2 1 2 
， 2 | 
表 志 s (2 ) 是 
1 11111111 
11122 2 2? 
1 22112 2? 
1 222211 
2 1 2.1,2 1 ?| 
， 1 2 2 1 2 | 
2 211 2 ?2 1| 
2 2 121 1 2) 
表 工 ;(3*) 是 这 样 的 : 


。 2658 。 
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一 一 -一 


CC 




















mw 请 一 
号 Co 上- co ro 六 
二 (CA -， CO NM co 

co ie mm ww mn 








(人 


ee 


2 1 

构造 正 交 表 的 方法 多 种 多 样 ,有 些 很 容易 ,例如 Le (27 )， 
Lie(25),L (3 有些 则 比较 复杂 ,例如 Lis (22 )， 有 些 参数 对 应 的 
正 交 表 是 不 存在 的 ,例如 没有 Ls (64). 构造 正 交 表 的 一 般 理 
论 见 [7]. 

我 们 指出 , 正 交 表 经 过 下 列 三 种 初等 变换 仍然 是 正 交 表 : 
@ 任意 两 行 互 换 ,G@ 任意 两 列 互 换 ,@) 任何 一 列 中 将 水 平 代号 进 
行 置换 . 因此 同型 的 正 交 表 是 很 多 的 . 例如 Les(27) 有 很 多 张 ,上 
面 所 列 的 是 其 中 一 张 ( 叫 做 标准 表 ). 值得 注意 的 是 ,可 以 证 明 所 
有 的 L(27) 经 过 上 述 三 种 变换 可 变 成 上 面 介绍 的 那 一 张 ,但 
Li6(2”) 就 没有 这 种 唯一 性 . 

如 何 利用 正 交 表 安 排 试验 ( 即 进行 正 交 设 计 ) 呢 ? 我 们 只 介绍 


r 生 FEI 记 IGIRRET LA HE 由 包 小 全 了 人 7 HT 一 上 -AAA PE 瑟 妆 RE 
不 考虑 因素 间 交 互 作 用 的 情形 ,此 是 刀 全 分 简单 . 工人 避 六 


互 作 用 的 情形 如 何 进行 正 交 设计 ,方法 比较 复 ,我 们 将 在 本 节 的 


一 盖 ii 7 人 -入 下 下 大 上 二 了 .Er -二 和 EE 


末尾 略 作 介绍 ,以 引起 读者 的 注意 . 要 更 多 了 解 考 虑 交互 作用 


一 一 
CA 
CD 


1 
3 让 


从 一 个 具体 例子 谈 起 . 
例 3.1 烟灰 砖 试 验 的 正 交 设计 . 


全 7 LA AN 可 


继续 例 1. 1 的 讨论 . 对 因素 和 水 平均 用 符号 来 表示 . 共有 三 


个 因素 Ar 上 险 型 水 AN Pr 夺 时 疝 I、 CCK(_ 次 研 压 料 重 ) 每 个 因 
PP 方 S ssL4 人 AN、 凡人 一 [人 /7 1 大 站 JJ AN 1 BE 让 了 T /9 于 


素 取 三 个 水 平 . 4 的 三 个 水 平 是 :4; (成 型 水 分 9%J, 4A: (成 型 水 
。 289 。 


AAA 105%% ),A; (成 型 水 作 11%%); 吾 .的 三 个 水 平 是 Bi (了 研 压 时 间 
8 ),B:;( 碾 压 时 间 10 ), B;( 研 压 时 间 12 );C 的 三 个 水 平 是 : C; 
条 1 1 厅 36 请 = TFI 和 和 1] 


如 9 种 ) 进 行 试验 ? 可 用 正 交 表 志 (3 ) 来 实现 . 和 
1 


C 随便 放 存 7 4 人 
和 刀 以 从 人 许 二 9 (3 1 





























表 3.1 
AS 列 (万 ， 《 碾 | 
二 验 SNN (成 型 水 分 》 | 〈 研 压 时 间 ), |.( 一 次 研 压 料 重 ) | 折 断 力 
1 2 3 

1(9%) 1(87) 1(330 kg) 16.9 

1(9%) 2(10 ) 2(360 kg) 19. 1 

3 ”1109 上) 3(127) 3(400 kg) 16.7 

2(10 耻 ) 1(8 ) 2(360 kg)- | 19.8 

5 | 2(10 色 ) | 2(107) 3(400 kg) 23. 7 

1 2(10% ) 3(12 ) 1C330 kg) 19. 0 

7 3(11%%) 1(8 ) 3(400 kg) 25.0 

8 3(11%) 2(10 ) 1(330 kg) 20. 4 

9 3(11 如 ) . 3(12 ) 2(360 kg) 23. 1 


怎样 分 析 试验 结果 呢 ? 首先 想到 直观 分 析 法 ， 以 成 型 水 分 为 
。 200 。 


例 ,可 将 三 个 水 平 下 的 平均 折断 力 


『 六 要 


断 力 是 17. 6,2 水 平 下 是 20.8,3 水 平 下 是 22. 8, 这 就 是 说 , 成 型 
AR Qt 


算出 .1 水 平 下 的 平均 折 


中 


je 人 有 1100 昆 好 有 好 的 后 量 关 的 相关 《本 2 3 。 对 于 和 便 压 时 
人 人 用 请 7L0 关 9 了 闪 有 -三 昌 4 全 \ 1 和 /9》/ 东区 万 本 时 
间 ,三 个 水 平 下 的 平均 折断 力 是 20.7、21.1、19. 6, 故 研 压 时 间 取 
1 4 是 Jj7 2 和 尖 目 1 FE 3 二 理 东 的 娄 十 一 全 亚 表皮 亚 二 
TV 几 取 车 人 亿 在 和 vv A 人 JJ 人 1 令 由 有 JJ4T 主 ?一 | 人 小- 广 二 有 太志 


个 了 

折断 力 是 18. 8、20. 7、21. 9, 可 见 一 次 投料 400 kg 最 好 , 极 差 
是 3. 1. 

综 上 所 述 , 有 下 列 三 条 结果 . 

(1) 成 型 水 分 影响 最 大 ,其 次 是 一 次 碾 压 的 料 重 ,再 次 是 碾 压 
时 间 ， 

(2) 成 型 水 分 是 11%% 好 , 研 压 时 间 是 10 分 钟 好 ,一 次 料 重 是 
400 kg 好 . 

(3) 最 好 的 工艺 条 件 是 : 成 型 水 分 取 11%% , 研 压 时 间 取 10 分 
钟 ,一 次 料 重 取 400 kg. 

。 值得 注意 的 是 ,所 指出 的 最 好 工艺 条 件 并 未 在 所 进行 的 9 次 

试验 中 出 现 . 

读者 自然 提出 问题 : L,(34) 表 的 好 处 在 哪里 ?上 述 分 析 计 算 
的 理论 根据 何在 ? 

下 面 对 多 因素 试验 进行 一 般 性 讨论 . 首先 介绍 如 何 用 正 交 表 
安排 试验 ,然后 讨论 数据 的 分 析 方法 与 理论 基础 . 本 讲义 只 讨论 


明 钱 的 有 昌 丰 村 田 人 价 估 失 导 形 可 模型 抽 下 亦 让 计 
取 屠 寺 、 也 到 有朋 关门 中 有 有 月/ 中 佣 己 主 虽 JI 从 以 扩 。 
什么 是 可 加 模型 呢 ? 考虑 因素 忆 (有 si 个 水 平 ) ,F( 有 s: 个 


-Lor NA 【1 NA 二 二 2 上 A 证 ] nm 、 AN 二 
人 小- 人 /9，， “上 (有 7 个 水 平 ) 对 指标 C 的 影 啊 ， 用 QaCAL，…y An ) 表 


示 丘 ) 取水 平 ) ,三 取水 平 人 ，。，， )，， 取水 平和 时 的 真 值 ,和 若 


本 一 本 ae 本 


一 上 一 一 工人 


QaCALA ，…，A， ) 有 有 下 列 分 解 式 : 


Q(Ali ) 作 ? An) 一 Qo 十 ai (7 ) (3. ]) 


产 ] 


各 因素 对 指标 a 的 影响 是 各 个 因素 分 别 影 啊 的 玲 加 ,因素 间 的 交 
。 2Z91 。 


互 影响 可 以 忽略 ， 可 加 模型 当然 是 一 种 特殊 的 模型 出 ,但 实践 经 


< AL ”人 二 ML 一 一 一 Jin 人 


验 表 明 , 它 广 泛 地 存在 于 实际 工作 中 , 而 且 即 使 实际 情况 不 完全 通 


合 可 加 模型 但 采用 可 加 模型 的 正 效 设计 安排 试验 和 常常 也 可 得 出 
[RNRI 天 ?| 一 仆 [/ 可 JJRIKHJJLL 人 六 Jr LE JJ HH 


有 重要 价值 的 试验 结果 ,特别 是 能 找到 比较 优良 的 工程 么 件 . 


THERFE wy ~ 放 庆 E 下 AN 户 厂 一 扩 nm 14 AN 1 > 一 和 着 < 一 上 ~ 一 一 下 Ar 


+ 要 注意 的 是 , 若 分 解 式 (3. 1) 存 在 , 则 它 不 唯一 ,但 在 下 列 条 1 
下 吏 唯 一 了 . 


由 


2 一 (7 一 上, 2，… 770) 《3. 2 


满足 (3. 2 的 分 解 趟 (3 1 叫做 标准 分 解 式 . 此 时 ca 正好 是 一 般 


-要 ” 榴 ”LA 


平均 凡 ,oa (ui) 正 好 是 因素 囊 在 水 平 久 ; 时 的 主 效 应 PN )， 以 下 


口 老 上 寺 榨 准 人 分解 坟 
人 和 信和 地 和 尖 钞 全 刀 放 F 工 


可 加 模型 下 的 正 交 设计 是 这 样 的 ， 设 因素 Fi，F: ，…,F。 分 


别 有 si,sz，…sw 个 水 平 . 丰 ; 的 各 水 平 由 1 …，,s 记 之 . 选 一 正 交 
表 ,将 已 ,FE 下。 任意 放 于 它 的 和 个 列 上 ,但 规定 忆 ， 必须 放 
在 水 平 数 是 *， 0 2,…,m. 将 这 些 列 保留 ,其 他 的 列 去 

| \ 一 呈 一 一 上 > 《fi 一 上 
把 ,得 到 | 1 (sl 头头 5 浊 ) 型 正 交 表 人 A 一 (人 )， 于 是 个 的 各 行 就 代表 


各 号 试验 条 件 . | 如 从 有 末 号 试验 条 件 ( 水 平 组 合 ) 是 ;因素 下， 


明 EL- 侍 Fe 虽 -一 一 一 


取 za 水 平 ,F 取 )Mz 水 平 ,…， 下 。 取 水平 . 换 句 话说 ， 4 实现 了 


站 HA 让 人 叫做 设计 阵 广 人 DT TI vin 姥 刑 二 壮 口 王 二 
JJ Cr 4 RARAI 1 PT 从 上 述 避 AM 如?A 人 -JUNHR4IKR 王 个 5 A 八 芭 人 


到 了 合适 的 正 交 表 , 进 行 正 交 设 计 是 十 分 容易 的 .把 各 因素 往 表 


的 各 列 上 放 , 有 相当 大 的 任意 性 . 
现在 来 研究 ,在 可 加 模型 的 假定 下 ,如 何 根据 正 交 设计 得 到 


AAA LA -一 2 LA av er 


| 
试验 数据 进行 分 析 . 设 各 号 试验 条 件 下 均 进 行 了 r 次 斌 


澳 : 
< 划 


中 ” 比 可 加 模型 更 复杂 的 是 带 简单 交互 作用 的 模型 : 


QCA1，… "Am) 一 ao 十 yw Gu) 二 2.av (A， 和) ) 


J 一 1 . . 


本 讲义 不 讨论 这 种 模型 下 的 正 交 设计 .所 谓 ” 不 考虑 交互 作用 时 的 正 交 设计 "就 是 指 当 
作 可 加 模型 时 进行 的 正 交 设计 . 
s。 2Z92 。 


(r 之 1) ,第 :与 试验 条 件 下 的 数据 是 yx (一 1，…,m,R 王 1，…，r). 
于 是 有 数学 模型 : 


和 一 记 十 >78(0) 十 ee (Ci 一 1 ， 一 1 wor) (3.3) 


一] 


其 中 4=(5 ) 是 设计 阵 ,es 是 试验 误差 ,我 们 假定 (ex } 是 相互 独立 
的 ,期 望 是 0, 方差 相 等 有 时 进一步 假定 es 一 N(0,c ). 注意 
(3. 3) 中 的 未 知 参 数 满足 约束 条 件 : 


“) ， 
NorN-n (一 1 5 ， (Q 4Y 
LA 人 II、 人 人 77 NA \/ Cr 9 归 YY 人 芋 
)， = 

我 们 的 第 一 项 任务 是 根据 试验 数据 估计 未 知 参 数 { 记 ,BC 


的 值 , 从 而 可 估计 出 <CM，…,)w) 的 值 .， 
(3. 3) 乃 是 带 有 约束 条 件 的 线性 模型 ,我 们 可 以 


的 一 般 理 论 . 令 


























>Y 一 9 太一 9 7 一 1 ,2 9 7/7 
、Vi CCS; ) 
/天 人 /7 
f 工 
&1 
] 
& 一 : 》 下 ,一 (s 个 了 虐 ) 
| 
人工) 








工 入 - 一 人 (Ai ) 屎 ) 


一- -一 
习 和 者 者 
车 

-一 一 一 一 一 一 
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和 友 . 一 (7 交 9 ) 、 
上 \ 必 怖 7 作 5) 
这 里 
人 & 一 忆 
SNV，，， vv 一 
《AN 人 | 
人 人 
人 V 9 (CC ALC/ 
入 一 (上 ,从 1， ) 信 ，) 
于 是 有 


半 一 入 。B 十 e 
这 里 X 被 设计 阵 4 唯一 确定 ,叫做 4 的 从 属 矩 阵 , 记 作 X(A). 由 
于 8 受到 约束 ,我 们 设法 引进 新 的 参数 ,它们 是 无 约束 的 . 
设 PP 是 * 阶 正 交 和 矩阵 且 有 结构 : 

















这 里 利用 了 关系 式 瑟 , pi;=0( 见 (3.4))， 于 是 
710 
二 7 
X8 一 ( 瑟 , ,Xi ，…，X，。) 
了 
[ 允 
[| 
奶 
一 (上 ,XITI，…， 和 了 ) 
【7m j 


以 下 记 
。 294 。 








《和 mr9LAl 工 1] 9 9 LA 荆 7 
网 
| 疙 
1 | : 
人 7 ， 
于 是 有 
Y 一 A7 十 
六 个 模型 甲 参 狐 ， 且 白 出 的 
业 全 | PR 二 二 人 人 IL- 轨 DDN 。 


7 
“ 引 理 3.1 RCR) 一 RCX)( 这 里 RA) 是 A 的 秩 )， 
证 明 : 令 


一 下 矿 1/ 


太 了 AAA T 
1 二 9 用 站 


网 








5 
X。T) 王 X 有 相同 的 秩 . 证 毕 . 
“ 引 理 3.2 设 4=( 人 5) 是 Lo X…Xs) 型 正 交 表 , 则 

Xi 一 -已 ,下 《iD 


XIX ;一 一 1， (4 是 : 阶 单 位 阵 ) 


) 


证 明 : 从 定义 直接 推 知 . 
“ 引 理 3.3 设 人 4 是正 交 设计 , 则 和 的 秩 等 于 


。 2Z90 。 


开 和 人 一 一 个 ! 瑟 , 忆 :T 一 0 





io 1) 
态 一 方面 
mrA Ar 九 一 /天 7H 
人 AAA) 1 7 1 
于 是 有 
下 丰 
$1 1 
SF1SY 1 
XX 一 二 一: 
>2 
| 
玫 站 
K ”7 / 
可 见 


R( 和 ) 一 RCXX) 一 1 十 > (5 一 1) 证 毕 . 
“ 系 3.1 设 4 是 志 (X…Xm) 型 正 交 表 , 则 有 重要 不 等 式 : 


过 让 


> (5 一 1) 委 2 一 1 


] 








| I 上 门 ITH OO nm -二 YozdHhN il 
证 有 : 从 引 1 理 3. 3 直接 推出 
?的 最 小 二 乘 信 计 是 
7 一 ( 训 ' 客 ) 一 训 ' 了 
人 一 三 玫 和 人 一 
人 ] 
| 熙 
| 
站 
T 


于 是 B 一 帮 G 亿 1)， B 一 77 ,不 难看 出 
。 290 。 











>4 _， 记 、 
疏 1 o ww ， 
一 -一 一- 一 局 Pt 号 ] 
忆 僵 ~、 代 了 袜 AN “mm 全 
\ 民 PC PC [ 信 ” ~ 2< 
口 已 、、 天 下 | SS 司 ， 一 、 r 一 
本 中 | 站 | > 们 < 
\ vv ”” CN 、 忌 人 ~ T 一 | co 一 和 人 3 vc 
| | 、 忆 | 
江 六 
人 4 忆 、 “wm， 羽 ，=， 。 
了 = > Pt 相 、 [ 了 
全 一 RS 可 可 R 可 有 os 匀 
Se 1 
2 (G5S (CD 
二 . 


T 


1 


(3. 5) 
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) Si ) 


(一 1，… 











则 


注意 了 帮 是 忆 的 》 水 平 下 全 部 数据 之 和 ,一 乃 是 该 水 平 的 


出 现 次 数 ,因而 世 Bx 乃 是 水平 下 的 平均 值 ， 故 公式 (3. 5) 的 意 
义 在 直观 上 是 相当 明显 的 
真人 QCAi Au ) 的 估计 值 是 


v] 9? AAA71I 7 0 


7 
6 
上/ 
1 


f 避 ) -Tv 


全 
”使 得 BCA 和 ) 一 max 记 (》) ， 则 》? ”就 


可 见 , 找 最 好 的 水 平等 价 于 找平 均值 最 大 的 水 平 . 当然 (入 
) 光 ) 是 最 好 的 工程 条 件 . 

在 上 面 的 分 析 中 有 一 个 重要 的 缺点 :未 分 析 试 验 误 差 的 大 小 . 
试验 数据 总 含有 误差 ,对 因素 已 ; 而 言 , 各 水 平 下 效应 估计 值 C(8， ) 
上 由 所 天 车 十 中 王 亚 不 后 IF6FE 片 还 是 主要 由 于 试验 吕 关上 生 7 
HNNJJAITT -HIJ LN 7 IJ 工人 人 L 人 -2 DO -向 天 下/ ) ER 


换 句 话说 ,应 该 检验 下 列 假设 : 
再 :8 (1) 一 … 一 BC) 一 0 


当 互 , 被 拒绝 时 (这 时 称 开 是 显著 的 ) ,才能 说 


AAA” 和 


标的 影响 有 差异 ， 哪个 水 平 最 好 


眉 大 检验 厅 ， 呢 ? 这 是 比较 复杂 的 
以 之 三 


方法 . 
(一 ) 直观 分 析 法 
试验 工作 者 根据 已 往 的 经 验 对 本 项 试验 中 的 误差 有 大 致 的 估 
计 , 可 以 判断 已 的 各 水 平 效应 估计 值 B (1),…,8 (的 差异 是 否 
主要 来 目 试验 误差 ,根据 经 验 来 拒绝 还 是 接受 瓦 . 当 妃 ;) 锌 拒绝 
。 2905 。 


时 ,挑选 殊 的 最 好 的 水 平 ; 当 万 被 接受 时 ,原则 上 可 随便 挑选 己 


| Ar 一 一 一 《f 疡 万 十 二 EE HE AS 和 Var 工 -hh 仁 记 ] 芭 


J 人 小- 下、 末了 过 有 应 根据 实 小 二 FF 的 其 他 需要 来 挑选 ). 也 外 元 寺 


验 挑 选 出 的 水 平 组 合 ( 例 如 (CA ，,…, AM )) 客 竟 是 不 是 最 好 的 工 


< 人 丰产 一 站 和。 


程 条 件 ?? 通常 要 进行 验证 试验 :对 所 选 出 水 平 组 合 ( 例 如 (Ai ， 
,15 )) 补 充 进 行 一 次 或 多 次 重复 试验 ,看 看 这 时 的 指标 值 是 否 


Ar AN 二 村 Ye 


达到 了 优 恨 的 水 平 ( 注 意 , 不 是 验证 最 好 ”, 而 是 验证 是 否 达 到 了 


灾 际 工作 所 要 求 的 “优良 ”)， 


-一 


(二 ) 方差 分 析 法 


2 我 们 在 全 面 ES 的 沽 控 全 大 三 
一 人 让 LO 议 全 请 日 人 了 由 从 失 人 人 企 王 团 也 和 有 人 扩 岂 了 | 
中 已 介绍 过 . 使 用 此 法 的 困难 在 于 :如 何 对 试验 误差 给 出 客观 的 


二 EN 我 们 指出 ,要 得 到 试验 误差 的 客观 估计 ,最 好 是 进 
行 重复 试验 , 即 各 号 试验 条 件 下 至 少 要 做 两 次 试验 . 

怎样 进行 方差 分 析 呢 ? 设 在 第 ; 号 试验 条 件 Ma，…,)an 下 的 
试验 数据 为 ya,，…yr. 在 数学 模型 (3. 3) 中 ,我们 假定 (ex } 独 立 
同 分 布 且 es 一 N(C0,c)(o: 未 知 )，. 

沿用 前 面 的 记号 B，, 房 ,CU ) 及 方 (0) 等 . 令 


1 / 
Sr = 羡 2 了 一 元 CT 半 y。) 人 


- 》 房 sw) ( 残 差 ) ,一 1 
(e 一 (E; ，…,E， ) ) 
= 二 (全 部 数据 的 平均 值 ) 


Le 


我 们 首先 证 明 下 列 恒 等 子 


所 


> 一 于 六 sr 了 《3. 8) 


) 一 | 


实际 上 ,了 =X7 十 E, 必 7 | e ,于 是 有 
YXOX7 十 ee 








7 天 
3 _ 
上 
1 
T | 
一 mo) 十 二 7 101 十 S. 


但 7o 一 了 故 
2 15277 十 S. 
我 们 指出 . 
7711 一 一 Sn (3. 9 ) 























故 (3. 9) 成 立 , 从 而 (3. 8) 成 立 . 
。300 ，。 


由 于 请 J 相互 独立 且 与 9 独立 , 缸 以 DF， 9 PDF ws 相互 
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独立 
利用 关系 式 
0 记 0 下 站 
从 (3. 8) 得 下 列 方差 分 解 式 
27(y 人 


7 兢 
人 1 j 
了 一 


5 
AN 
(人心 
铺 1。 
| 
(一 
wa 


后 


其 中 
六 交 二 光 ) (= 一 ya 


是 误差 平方 和 ， 


二 \ 了 FF dh -> 
有 JJ wyr 7 一 、J> 大 JJ 2 29J 7 八 A 信 全 H 
k 人 = 1 
3。 1 人 





DFI ， 9 四 
1 信人 yi 网， 二 (7r 一 1))( 当 > 
Z i=10 4=1 
由 于 
5 
六 一 Nm, 三。 
故 
(太一 态 )( 方 一 衣 ) 一 X (5 一 1) 
在 假设 瓦 ;( 见 (3.6)) 下 
二 有 二 Re 
2 17 7 人 疏 ”) “有 


人 
性 
AAA 这 oo ] 
SR \ 51 工 / 


() 
Q/7C7r 一 ]) 


| 


在 刀 ; 下 开 77~FGs 一 1,2Gr 一 1))， 故 可 用 统计 量 F2 来 检验 假 
在 上 面 介 绍 的 方差 分 析 法 中 要 求 各 号 试验 条 件 下 均 进 行 


过 
重复 试验 (重复 数 >2). 如 果 不 作 重复 试验 ,每 号 试验 条 件 下 只 
有 一 个 试验 数据 (分 别 用 y ,… 表示 ) ,怎样 对 假设 (3.6) 进 行 

作 


JR 让 妈 ]\ 万 力 站 JI ， 》.y7 人 sw7L 人 本 LS 


检验 ”? 本 这 时 对 试验 误差 难 以 





于 是 在 瑟 ;( 见 (3.6)) 下 
SF71Cs 一 ]) (3. 12) 
7 


服从 FCs 一 1, 记 . 

ES 

如 采 检 验 的 结果 是 拒绝 娓 ;, 则 表明 因素 媚 是 显著 的 ( 即 它 的 
不 同 水 平 中 至 少 有 两 个 对 指标 的 影响 有 差异 ). 如 果 检 验 的 绪 果 
不 能 拒绝 互 , 而 和 目 由 度 又 相当 大 , 则 表明 因素 已 的 不 同 水 平 对 
指标 的 影 喝 无 差异 . 当 自 由 度 了 比较 小 又 不 能 拒绝 五; 时 ,只 表 
明 :从 试验 数据 来 看 未 发 现 所 的 不 同 水 平 对 指标 有 不 同 影 啊 . 

7 (5 X…Xs) 型 正 交 设计 情形 下 (无 重复 试验 ) 的 方差 分 析 
表 如 下 : 


。 了 02 。 


方差 来 源 | 平方 和 自由 度 下 值 显著 性 





SF /5 一 1) 
S./j 
下， JDF， S2 一 5 全 
和 
人 
误差 S. 同 让 | 
| 


“人 Sr 


表 中 因素 书 的 水 平 数 是 5 (i=1,…,zm) ,Sr 的 计算 公式 见 (3.7)， 
93, 的 计算 公式 见 (3. 11). 





二 忆 o 一 忆 ) 一 23 一 人 
例 3. 2 姻 灰 砖 试验 的 方差 分 析 


继续 例 3.1 的 讨论 姐 握 日 往 的 宝 险 红 验 . 可 以 认为 所 考 上 


一 一 人 | J 9 一 FJYJ YL TU 让 | 用 玉龙 一 [二 7 AAA 


的 三 个 因 索 对 折断 力 的 影响 适合 可 加 模型 根据 前 面 给 出 的 试 


邮 


- 


千 


和 评 队 兴 握 . 4 县 -六 疾 人 大 关 译 坟 nn 下 ， 
人 以 了 天 妈 戎 人 刀 在 内 人 胡 XH 下 : 





方差 来 源 平方 和 |. 自由 度 上 值 显 着 性 
力 4 





查 下 分 布 表 知 临界 值 习 ss(2,2)=19.0, 故 在 显著 性 水 平 c 王 
0. 05 时 三 个 因素 都 不 是 显著 的 由 于 于 误 闭 的 自由 度 太 小 ,这 只 表 


明 从 本 试验 的 9 个 数据 来 看 未 发 现 因素 的 不 同 水 平 对 折断 力 有 不 
但 是 ,根据 以 往 类 似 的 试验 工作 的 经 验 ,同一 条 件 下 试验 两 


次 ,折断 力 指 标 一 般 相 差 不 超 过 1. 采用 直观 分 析 法 ,直接 对 三 个 
因素 的 不 同 水 平和 下 的 指标 平均 值 进 行 比 较 ,可 以 认为 三 个 因素 都 


4 态 有. 了 SA = 和 9 1 AUO 


对 折断 力 有 影响 ,最 好 的 工艺 条 件 就 是 以 前 说 过 的 :成 型 水 分 


] 1] 0%h4 碾 压 时 间 10 分 ,一 次 料 重 4nn Le 
LU 9 HI 本 二 有 愉 F AI = 瑟 NA 了 全 了。 


例 3.3 某 化 工厂 生产 一 种 试剂 ,长 期 以 来 收 率 一 直 不 高 ,只 


0 二- 半 了 了 担 全 人 人 兹 相间 人 这 上 比 了 半 下 万 | 口 从 氏 考 
[1 民 门 。 和 了 呵 1 -全 ， 想 进 行 一 JUN TI 人 尔 


有 65 
可 能 对 收 率 影 响 较 大 :反应 温度 .反应 时 间 、 硫 酸 浓度 、 硫 酸 产 地 、 
操作 方式 ,每 个 因素 想 比 较 两 个 不 同 的 条 件 ( 水 平 )， 具体 是 : 


my 在 、 A_ ren em A,(70 “ 
LE LI ~ / ?9 \ 学 


4 人 2 
小 时 ) ,B,(2 小 时 ) 


可 可 人 


全 


可 
世 | 
四 


《 


C( 硫 酸 浓 度 ) : CC(17 站 ),C: (27 听 ) 
D( 硫 酸 产地 ) ，D, (天 津 ) ,D;( 上 海 ) 
尼 ( 操 作 方 式 ) : 瑟 (搅拌 ) ,下 (不 搅拌 ) 
这 是 五 因素 .每 因素 二 水 平 的 试验 ,可 用 正 交 表 Ls(2 ) 来 安排 . 例 
如 将 4,B,C,D, 刁 依次 放 在 该 表 的 第 1,2,3,4,7 各 列 的 上 方 , 即 
得 试验 计划 . 现 将 试验 计划 和 按 计 划 进 行 试验 得 到 的 数据 以 及 分 
析 计 算 过 程 写 在 同一 张 表 ( 表 3.2) 上 . 

表 3. 2 的 意义 如 下 :试验 号 1 至 8 表示 8 次 试验 的 具体 内 容 ， 
例如 第 4 号 试验 对 应 的 行 是 1.2、.2、.2、1, 即 因素 A 取 Ai: 水 平 ,B 
取 了 B: 水 平 ,C 取 C， 水 平 ,D 取 万 ;水平 , 刁 取 五 ;水平 . 工 表示 各 
列 中 1 an [表示 各 列 中 2 对 应 的 各 数据 之 和 ,各 


因素 所 在 列 的 二 一 六 ,时 在 一 上 分 别 是 该 因素 1 水 平 与 2 水 平 的 效 


应 . 各 因素 所 在 列 的 下 方 的 S$ 是 该 因素 的 水 平 变动 产生 的 数据 的 
波动 平方 和 . 以 因素 A 为 例 , 从 (3.7) 知 


。 304 。 
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表 3.2 


数据 (0 ) 
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Cr 一 





一 CQ en 如 SC oo 
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] 人 
) 一 去 王 《TI= 


和 
1 


(C[: 十 工 


2 
4 一 去 


1 


到 


一 二 CI: 一 I) 


这 里 工 , 工 : 分 别 表 示 第 1 列 的 和 工 . 


一 (SA 十 Se 十 Sc 十 So 十 Se) 


方差 分 析 表 如 下 : 


“ 00 。 


性 (a 一 0. 05 ) 





人 显著 
12178 
B 8178 1 下 
E 36178 1 
D 36178 1 下 
开 8178 1 
_ 郑 3478 2 
因素 C 


C 也 是 显著 的 , 故 硫 酸 浓 度 是 27%% 的 好 ,上 海产 


J 忆 - 记 HA 9 RAW 号 RY 了 [人 CTAURJAJ 17/ 1 


方差 来 源 





ph 全 
Oo NAN Oo 二 





Do /Oo 


放 
六 


[5 
必 二 呈 


姜 一 O、 


津 产 的 好 . 其 他 因素 的 两 个 水 平 对 收 率 的 影响 未 显示 出 差异 ， 


Fr 巷 到 [全 HAD 提 人 人 全 外 HI 森 全 4 时 近 2 /这 各个 H 刀 
层 到 工时 久 吉 作 方 | 全 ?A 人 个 DJ -了 AAA 工人 牙 门人 1 二 19?、 人 2，? 


万 )， 下; , 即 反 应 温度 50. 反应 时 间 ] 小 时 ， 硫酸 浓度 275% , 硫 理 


YA -is 一 上 上 上 这 /一 一 一 让 二 7 4- AIEE 了 了。 = AI 情态 / 呈 


选 返 上 海产 的 ,操作 方式 是 不 搅拌 (值得 注意 的 是 ,这 个 最 好 条 4 
并 未 在 8 次 试验 中 做 过 )， 


是 


这 种 用 正 交 表 直接 进行 分 析 计 算 的 方法 带 有 普遍 性 用 其 他 


正 克 表 时 ,计算 方法 类 人 从 四 


『 
二 ~ -入 - 人 JIA AAAL ANrR。 


'“ 例 3.4 拉丁 方 设计 与 数据 分 析 . 

在 农业 .生物 等 领域 常 使 用 拉丁 方 设 计 , 它 与 采用 正 交 表 的 正 
交 设计 有 实质 的 联系 ,我 们 可 以 认为 它 是 一 种 特殊 的 正 交 设 计 . 

先 从 一 简单 情况 谈 起 . 设 有 4 种 小 麦 品种 A,B,C,D 种 在 - 
块 方形 田 里 ,要 比较 产量 的 高 低 . 为 了 消除 (或 减少 ) 土 地 纵 回 利 


ee 一 


模 回 肥效 不 鱼 的 影响 ,以 比较 品种 的 优 和 劣 ,将 方 田 分 为 16 等 分 ,种 
法 如 下 : 


吕 


De 


4 





列 
风 1 2 3 4 
人 
Ta Tec 
2 已 人 已 CC 
De 
人 


每 个 品种 在 每 行 每 列 中 各 出 现 一 次 . 比较 各 品种 的 平均 产量 就 可 
知道 各 品种 的 优 劣 . 

定义 3.2 & 个 处 理 册 1,2,…,& ,安排 在 &XR 方 阵 内 ,使 每 个 
处 理 在 每 行 每 列 均 出 现 一 次 . 这 样 的 一 个 安排 叫做 EX 义 & 拉 丁 方 
设计 . 

显 伏 , 在 这 种 设计 中 ,每 个 处 理 重复 了 & 次 … 我 们 说 拉丁 方 设 
计 实 质 上 是 三 因素 的 正 交 设计 , 即 Ze (及 ) 型 设计 . 三 个 因素 是 : 


@ 行 (每 行 看 成 一 个 区 组 ), 共 有 上 个 水 平 , 用 1,2,…,& 表示 . 





GO 列 , 共 有 下 个 水 平 , 也 用 1,2,…, 上 表示 . 图 处 理 ， 其 有 站 个 水 
平 . 有 &X& 拉丁 方 设计 可 用 下 列 工 2 (名 ) 型 正 交 表 ( 表 3. 3) 来 实现 . 
这 QQ ARA 

证 本 
行 列 处 理 数据 
] | A1 1 
1 2 人 2 .2 
1 R 人 JIA 
肌 ] Ak 二 1 VA 二 1 
史 2- 全? 7 尺 十 乙 
2 民 人 2 3126 
R ] 人 Ce 一 1D)A+1 YE 一 TDA+1 
R 0 人 (一 1)A 十 2 VER 一 1)8 十 2 
R 民 人 82 TVp 
yahiTR 记 三 RH 
人 一 | _LL 人 [-“ 呵 2 大 玫 \_ 一 JJ 


由 “处 理 ” 两 字 作 广 义 的 理解 , 见 第 三 章 》6， 上 1 


AL. 一 上 ， 用语 人 一 


4 人 3 | 3 EL EE 
人 人 +Hl 一 代 ? 人 AH2 一 上 上， 9 人 一 玉 二 


AM 一 AR 一 工 ， Azk+2 一 久 ， A3akH3a 一 |， 人 3 一 外 一 <. 


ADHI 一 2， AD 一 3 和， 一] 
统计 分 析 实 为 正 交 设计 情形 下 的 数据 分 析 . 用 8, 表示 表 3. 3 


申 第 列 水 平 》 对 应 的 数据 之 和 ,例如 Buy 十 总 十 :十 %。 用 了 
表示 全 部 数据 之 和 , 即 T= 六 y. 要 比较 不 同 处 理 的 效果 , 则 应 比 


AN TAI [ 击 、 
| 和 有: 


并 


汪 (A 一 1，…,) 


为 了 检验 各 因素 (行列 . 处理) 是否 有 影响 ,有 下 列 方差 分 
析 表 : 


万 妆 来 下 


行 si= 工 成 一 1 


/一 | 





CDC2) 





了 2 
充 关 Sa 一 >》 并 一 元 一 己 行 一 多 列 一 处 理 





除了 行 、 列 .品种 三 个 素 外 册 加 一 个 因素 一 一 施肥 方式 ,党 
样 安排 试验 才能 比较 不 同 品 种 (或 不 同 施肥 方式 ) 的 优 少 ? 著名 的 
人 人 -Pen 及 己 上 TI JJHNHN4 “JEBAA AN7L HL 月 1/ 


安排 是 所 谓 希 腾 拉 丁 方 设 计 . 设 各 个 因素 都 是 四 个 水 平 . 四 个 癌 
种 :人 A, 忆 ,CC; 四 种 施肥 方式 :cyp8， 7 0， 日 可 如 下 安排 . ， 
。 308 ， 


病 1 2 3 4 
4 忌 

] 4,a 甩 ,8 L 7 忆 ,9 

l 已 ,7 人 ,6 Da CC 0 

3 CC 太 ,7 及 ,0 忆 ，a 


4 忆 ,B Caw 卫 , A,7 


含义 是 :在 每 一 小 块 田 ( 共 16 块 ) 上 拉丁 字母 表示 种 植 的 小 麦 品 
和 hy 关上 星 守 央 志 元 放 上 天 二 人 rr 全 有 只 41 广 4d 拓 了 必 
种 ,和布 脐 字母 表示 施肥 方式 . 十 有 RPR JJ 可 -了 9 工人 拉丁 刀 区 


计 , 全 部 希腊 字母 也 构成 4X4 拉 丁 方 设计 ,而 且 这 两 个 拉丁 方 设 


人、 全 -二 ~ 小 七 ZI 人 人 mAN 工 Ti YA 请 TIT 
计 有 特殊 关系 : (4A，,a)，(,8)，， 9 DO) 台中 志 一 钛 . 人 四 以 了 


做 希腊 拉丁 方 设计 . 
情形 : 设 品 种 有 
人 


We 配 @ 7 


ai 个 wm， 使 得 每 行 中 每 个 A, 恰 出 现 一 次 ,每 个 


愉 由 更 竺 克 市 且 Ji 责 日 (4 页 六 2 个 方块 中 恰 出 现 一 
IE LH ZU TY， 二 > 也 和 是 旭 此 ,而 且 (4,， J7 人 性 天 刀 议 下 提 DHL4 


次 . 这 实质 上 是 e (有 ?型 设计 .可 以 证 明 有 6 时 这 种 设计 均 存 
在 (二 0 时 是 1959 年 才 发 现 的 ), 但 & 一 6 时 不 存在 ,这 是 1901 年 
用 穷 举 法 得 到 的 结论 . 
布 脐 拉丁 方 设 计 是 一 种 正 交 设计 ， 可 用 正 交 表 来 进 和 了 数据 
分 析 . 
更 一 般 的 是 所 谓 正 交 拉 了 于 方 设 计 , 它 实质 上 是 Le 《Ar 7) 型 正 
交 设 计 . 可 以 证 明 , 当 & 是 素数 或 素数 寡 时 ;存在 Le ( 居 ) 型 正 
交 表 . 有 兴趣 的 谈 者 可 去 参看 L5j 和 (7]. 
附 :考虑 因素 间 交 互 作用 的 正 交 设计 简介 
我 们 将 以 La (27 ) 为 例 说 明 有 关 的 概念 和 方法 . 先 引进 一 般 性 定义 . 
定义 3.3 设 4 一 (ov )wxn 是 工 。 (5 勾 … “Xs) 型 正 交 表 ， 1 委 六 和 m ,1 到 
产 委 moTsA< mm 上 且 廊 , 力 疏 两 两 不 等 , 称 第 上 列 是 第 九 列 和 第 疡 列 的 一 
交 五 列 , 若 对 一 切 症 所 如 (1 委 委 2m1 委 委 2 ,只 要 (，,，) 一 出 
4 ) 障 一 定 成 立 Ai 一人: 


8 
汪 


玉 个 (水 平 ) :AAA ,施肥 方式 也 
9 有 X 开 方块 ,每 个 方块 


一 -AAA 一 喇 LA 


对 于 前 面 介 绍 的 志 as (2 )( 标 准 表 ) ,不 难看 出 第 3 列 是 第 1 列 和 第 2 列 的 


II 住 _. 克 石 旭 和 馆 S 帮 [月 馈 1 7 硬 I 和 和 负 4 研 的 有 唯 丰 石 如 。-。 灶 王 六 个 
“ 挛 人 一 JJ? vv ~， JJ 丰 Ai 上 > JR > JRJ -从 -一 JJ? 。，AJ JJ 


任何 两 列 都 从 有 一 人 





注意 ,由 于 第 疡 列 和 第 ) 列 的 交互 列 也 是 第 ) 列 与 第 九 列 的 交互 列 ， 
而 且 任 何 两 列 的 交互 列 只 有 一 个 , 故 在 上 面 的 表 中 只 对 六 < 疡 时 给 出 第 了 
列 和 第 jz 列 的 交互 列 是 第 几 列 . 例如 第 2 列 和 第 4 列 的 交互 列 是 第 6 列 ， 
(注意 ,对 于 Le。(34) 来 说 ,任何 两 列 的 交互 列 是 其 余 两 列 , 对 于 工 z? (33 ) 和 
Le (25) 则 有 较 复 杂 的 交互 列表 ! 见 [20]. 还 有 正 交 表 不 含有 交互 列 , 例 如 
TUC2 

下 面 举例 说 明 考 虑 某 些 交互 作用 时 如 何 进行 正 交 设计 . 

例 3.6 考察 拖拉 机 在 不 同 作 业 速 度 下 某 些 部 件 对 驾驶 员 耳 旁 噪声 的 
影响 ,拟定 的 因素 及 其 水 平 如 下 表 所 示 ,并 要 考虑 交互 作用 AXB 和 A4X( 
的 影响 . 试验 指标 是 耳 旁 噪声 ,指标 值 越 小 越 好 . 52 


因素 水 平 表 
因素 有 已 亿 记 
水 平 (速度 ) (驾驶 室 ) (轮胎 ) (风扇 ) 
] 焉 挡 开 式 通用 加 宽 改进 型 
2 T 挡 闭 式 越 野 普通 型 


正 交 设计 的 步骤 是 : 


11 洗 取 侣 活 的 正 丰 老 本 例 中 每 个 因素 两 个 水 平 
\“ 从 口 下 HL 下 和 余 丈 :全 四 和 寺内 于 扑 开 人 1 


虑 的 两 个 "交互 作用 ”" 共 六 个 “因素 ”( 每 个 “交互 作用 "看 成 一 个 “因素 ”). 
正 交 表 工 ; (27 ) 是 合适 的 ,其 列 数 超过 6. 


有 


(2) 将 字母 4,B,C, 适 当地 放 在 工 *(27) 的 某 4 个 列 的 上 头 ( 这 叫做 表 
头 设 计 ) ,原则 是 :避免 单个 因素 与 要 考虑 的 “交互 作用 ?混杂 ,其 具体 含义 是 : 
使 得 每 个 因素 所 在 的 列 不 能 是 要 考虑 其 交互 作用 的 两 个 因素 所 在 列 的 交互 
列 . 例如 ,看 将 双 放 在 Las(C2 ) 标 准 表 的 第 1 列 上 ,如 放 在 第 2 列 上 ,由 于 要 考 


攻 认 五 作 田 4A 广 玉 前 | 人 门 孝 不 能 放 在 策 2 列 上 央 光 第 3 可 县 馆 万 [了 0 
pe -太一 上 人 4 人 和 仆 友 ?人 人 ] C 部 不 HE ALT JJ 工 /7 JJ 和 EM 上 JU 


列 的 交互 列 ) ,行将 C 放 在 第 4 列 上 , 则 第 5 列 上 不 能 放 D( 因 为 第 5 列 是 第 1 
列 与 第 4 列 的 交互 列 , 而 交互 作用 AXxC 又 是 我 们 要 考虑 的 ),D 可 以 放 在 第 


了 有- -一 一 二 了 及 v 一 上 AD | 


7 列 上 (也 可 以 放 在 第 6 列 上 ). 这 样 在 .Ls (2 ) (标准 表 ) 的 某 些 列 上 安排 了 
因 系 ,有些 列 体现 了 “交互 作用 ”, 此 外 是 空 列 (未 安排 因素 也 不 体现 要 考虑 的 


an 


“交互 作用 ”). 刚才 的 安排 形成 < 表 头 设计 ?”， 


4 个 因 鹤 HI FF 
?II | 了 太 AH _-L- 
) 


因素 | AAA 有 忆 A4xB C 4A4xC DD 


(os 13) 
列 吴 1 2 3 4 5 6 7 
TREE YY 2 六 十 FL AT 99 一 一 过 nm 生 - Vi 人 AU 口 i 一 一 Aie 1 站 AAA 
要 注意 的 是 ， “ 表 头 设计 小 让 rrE 一 的 . 将 4， 甩 ,(， 1L/ 万 刘 有 人 让 2 上 >、 禾 7 
4 列 、 第 2 列 | 、 第 7 列 上 也 可 以 ,此 时 第 5 列 体现 交互 作用 AX 刀 ,第 6 列 体现 
KR 五 作 田 玉 广 ~ 
-有 | 三 可 妨 六 了 ve 
(3) 写 出 试验 方案 
在 志 (2 ) 上 按照 上 述 表 头 设计 (3. 13) 将 因素 A， 吕 ,C 所 在 的 列 ( 即 第 


1] 2 、4 了 7 列 ) 取 出 来 ,把 各 列 中 的 数字 换 成 对 应 因素 的 水 平 ,1 对 应 水 平 1,2 
对 应 水 平 2, 这 就 构成 了 试验 方案 . 内 容 如 下 . 





拖拉 机 噪声 试验 方案 表 
W 办 (1)A (2)B (4)C (7)D 
试验 速 度 轨 驶 室 轮 胎 风 剧 
1 (1) 亚 挡 (1) 开 式 (1) 普 通 加 宽 〈1) 改 进 型 
(1) 亚 挡 (1) 开 式 (2) 越 野 (2) 普 通 型 


l 
3 


(1) 亚 挡 (2) 闭 式 (1) 普 通 加 宽 (3) 普 通 型 


。 3 。 


续 表 





因素 (DA (2)B (4)C (7)D 
试验 号 、 速 度 驾驶 室 轮胎 风 遍 
4 (1) 亚 朱 (2) 闭 式 (2) 越 野 (1) 改 进 型 
5 (2)I 挡 (1) 开 式 (1) 普 通 加 宽 (2) 普 通 型 
6 (2)I 挡 。  (D 开 式 (2) 越 野 (1) 改 进 测 
7 (2) 下 挡 (2) 闭 式 1) 普通 加 宽 ”(1) 改 进 型 
8 





(2) 了 挡 (2) 闭 式 “ (2) 越 野 (2) 普 通 型 


以 上 就 是 用 正安 表 设 计 试 验方 案 , 即 进行 正 交 设 计 . 下 面 仍 以 上 述 拖拉 


太 站 [E 扫 YA 计 LN YE 人 hb 嫩 让 下 上 光大 一 3 器 AI 雪 ”全 下 ETA 一 一 
2 和 外 六 了 [JRHA7 DJ 和光 7 TRNA JI 和 刀剑 PT /JJ 


案 进 行 试 验 获得 了 试验 数据  ,y ，……y ,这 里 % 是 第 ; 号 试验 下 驾驶 员 的 
耳 旁 噪声 值 ( 单 位 是 分 贝 , 即 dB)， Ra 理 方 法 见 下 表 . 


”人 人 》 国民 WE 


试验 结果 分 析 表 
因素 | 4 B 4AxB C 4xC 
试验 身 1 2 3 4 5 6 

1 1 1 ] 1 1 1 1 92 
2 1 1 1 2 2 2 2 98 
3 1 2 2 1 ] 2 2 94 
4 1 2 2 2 2 1 Is 97 
5 2 1 2 1 2 1 2 94 
6 |” 1 2 2 1 2 1 |  ，93 
7 2 2 1 1 2、 2 1 -86 
8 2 2 1 2 1 ] 2 91 
381 377 367 366 370 374 汪 


中 


364 368 378 379 .375 .371 377 | 


es 













95. C9 94. 25 91.75 91. 50 92.50 93. 00 92. 00 





91. 00 92, 00 94. 50 94. /5 93. /5 94. 15 94. 29 





表 中 各 列 的 工 表示 “1 对 应 的 数据 之 和 ,各 列 的 开 表 示 “2" 对 应 的 数据 


-2 天 例如 人 1 万 [80-T 一 、、 十 十、 十、 2R&1 人 第 1 5 引 60T 一 十 十 十 
心 -小 H 。 JXH937 LDL 一 IT TAX do, 宛 上 镍 隐 上 yy5 36TTY7 


o RAW T 表示 该 列 上 的 因素 的 水 平 1 
下 数据 的 平均 值 , 各 列 的 二 下 表示 该 列 上 因素 的 水 平 2 下 的 数据 的 平均 值 ; 


极 差 R 一 | 于 工 一 于 下 | 则 表示 该 列 上 的 因素 的 两 个 不 同 水 平 对 指标 (噪声 
值 ) 带 来 的 差异 显然 极 差 越 大 , 则 不 同 水 平 带 来 的 差异 越 大 ， 对 于 体现 “ 交 


地 -一 so RR 正 是 刻画 该 列 Fe 


互 作 用 ”的 各 列 来 说 ,可 以 证 明 各 列 对 应 的 极 差 尺 正 是 刻画 该 列 记 体 现 的 
“交互 作用 ”的 大 小 ,R 越 大 表明 “交互 作用 " 越 大 ,R 太 小 则 表明 该 “交互 作 


由 一 人 记 7r ier 7 了 AM -rm 口 口 1 :et 、\ -we 加 好, Jr ce TY 了， 了 kr DIE ES 7 人 -人 66 -ce 


用 “可 以 和 忽略. (数学 证 明 从 酷 ). 总 之 ,按照 极 差 从 大 到 小 ,将 因 票 (包括 “ 交 


互 作用 ”) 排 上 次 序 , 以 显示 其 重要 程度 . 在 本 项 试验 中 ,各 因素 及 “交互 作 


FH 9 -jhr ET 3 1 -上 -if Ar vAr FE 蝗 
| 攻 人 也 去 个 人 到 人 小 的 次 厅 是 


昌 和 
已 


4XC 所 在 列 的 “ 极 差 ? 相 当 小 ,可 以 忽略 .C 的 两 个 水 平 中 Ci 比 C: 好 ,D 的 
两 个 水 平 中 D, 比 D, 好 (因为 相应 的 革 工 比 邯 工 小 ) 而 AX 巨 所 在 的 第 3 


列 对 应 的 “ 极 差 " 超 过 因素 B 所 在 列 对 应 的 “ 极 差 ”， 因而 要 重视 4Ax 刀 , 即 了 要 
研究 因素 4 与 已 的 水 平 搭配 对 指标 的 影响 . 为 此 要 研究 二 元 表 ， 


Pi 了 


SS 














页 SA 六 已 
A， 人 
上 2 2 
94 十 93 86 十 91 
4 | 本 一 93.5 一 88.5 
到 < 四 本 
这 个 表 用 来 表示 因素 4 和 吕 assay 和 aging 例如 A 
取水 平 1.8 取水 平 1( 即 A 下 共有 两 号 试验 :第 1 号 和 第 2 号 ,试验 数据 
辐 y: 十 ya 92 十 98 rm 六 、 一 一 | 一 
的 再 均值 为 二 一 一 5 5 -一 95,A 取水 平 1、 8 取水 平 2( 即 4 DB ) 下 旭 有 
十 94 十 97 
两 号 试验 :第 3 号 和 第 4 且 ,试验 数据 的 平均 值 为 办 5 蔚 一 一 “二 95.5, 其 


余 均 类 似 地 算出 . 


从 汶 个 一 元 表 看 由 捞 酚 4A， 最 好 (因为 平均 噪声 最 小 )， 
因为 平均 噪声 了 最 小 


/1 Am】 一 一 -AL 户 世 < 2 已， 于 二 人 4 


总 之 ,四 个 因素 的 水 平 的 优良 组 合 是 A; B: CDi ,这 就 找 出 了 优良 的 工 
程 条 件 :速度 用 工 挡 . 驾驶 室 用 闭 式 、 NI 加 宽 而 风 刷 用 改进 型 . 此 条 


” 


件 下 轰 驶 员 耳 劳 噪 声 最 小 . 

以 上 是 用 一 个 例子 粗略 说 明 考 虑 交互 作用 时 的 正 交 设计 及 数据 分 析 方 
法 (未 介绍 方差 分 析 法 ) ,所 用 方法 可 以 推广 到 较 大 的 表 Lis(25) 和 Laz (22 ) 
上 去 ,虽然 所 遇 到 的 情况 比 Las(27) 时 要 复杂 得 多 ;也 可 推广 至 Lzz (3 ) 及 某 


起 惠 香 龙 的 去 上 示人 但 情 癌 惠 次 香 大 《全 |D 7 (383 ) 中 任何 两 列 的 交互 列 有 
于 双 有 又 本 H 衣 直人 有 ?一 站 Mu 全 肥 水 ， 了 XAH L27《3 I 导 站 PP 全 了 > 有 


两 列 ). 要 了 解 这 些 复 杂 情 形 下 的 正 交 设计 ,请 看 专著 [7j 和 [L20j. 
我 们 指出 ,还 有 许多 灵活 使 用 正 交 设 计 的 方法 ,例如 拟 因子 法 、 拟 水 平 


了 Te 本 


法 .并列 法 、 直 积 法 、 部 分 追加 法 ,等 等 ， 可 参看 [20] 
3$4 平衡 不 完全 区 组 GBIB) 设 计 


这 种 设计 在 农业 、 林 业 中 较 多 使 用 ,从 一 个 例子 讲 起 . 
例 4.1 设 有 四 种 小 麦 品种 :4A.B、C、 了 ,又 有 四 个 区 组 ,每 个 
区 组 恰 有 三 个 单元 ,同一 区 组 里 土壤 条 件 一 样 ,不 同 区 组 可 能 有 
较 大 差异 . 问 : 如 何 安排 品种 种 植 以 比较 各 品种 产量 的 高 低 ? 
有 一 种 试验 安排 是 这 样 的 : 


TT 半 


| 下 下 

PP A C 3B 

4B AD CI,LI, 区 ,KR 是 四 个 区 组 代号 ) 

CD D SGCG 
(把 区 组 内 的 总 em 得 的 代号 了 下方 这 种 安排 有 如 下 特 
所 让 -二 | fb 日 内 不 能 将 后 品种 都 安排 下 ( 二 > 人 性 、\ 只 安排 二 
AN 2 ML 1 | 全 一 已 本、 有 尼 将 所 口 人 1 有 有 PP 人 JP 不 完全 性 ) ,只 安排 = 
个 不 同 的 品种 ， 每 个 人 样 多 ( (者 是 三 次) 而 且 每 一 
对 品种 出 现在 同一 区 组 的 次 数 一 样 多 (都 是 二 次 ). 这 种 设计 叫做 


平衡 不 完全 区 组 设计 ,简称 BIB 设计 . 


BIB 设计 的 一 般 定义 是 : 设 有 Y* 个 处 理 ( 如 覃 种 ),8 个 区 组 ， 


。3314 。 


区 组 的 大 小 是 .A( 即 各 个 区 组 一 样 大 ,每 个 区 组 只 能 含有 个 处 


< Ar 人 FF OH PE 六 必 玉 个 处 TH 大 本 信 A_IFR ZOHO 岂 久 


理 ). &<:, 和 大 在 每 个 区 组 里 都 安排 下 太 个 处 理 使 得 和 个 区 组 里 的 


安排 有 如 下 人 性质: 每 个 处 理 出 现 次 数 一 样 多 (叫做 处 理 的 重复 数 )， 


一 一 3 记  w es 人 阁 EL 人 一直 


每 一 对 处 理 出 现在 同一 区 组 的 次 数 一 梓 多 (叫做 相遇 煞 ), 则 称 这 
样 的 安排 是 BIB 设计 . 


居 人 


在 BIB 设计 中 ,用 > 表示 处 理 的 重复 数 , 用 、 表示 相遇 数 . 
定理 4.1 在 BIB 设 计 中 ,各 参数 有 下 列 


PR ?3 也 二 世人 吴 JS A 小 。 
\ 


地 


OO 
六 一- 入 ( 3 
FA 六 一方 荆 / 


证 明 :第 一 起 是 显然 的 ， 现 证 第 二 式 . 任 固定 一 个 处 理 人 及 
处 理 Ai;(GS7)，(A,， Ai;} 共 在 1 个 区 组 中 出 现 . 含有 A; 的 区 组 共 六 
个 ,这 样 的 每 个 区 组 包含 A, 以 外 的 处 理 有 & 一 1 个 ,因而 这 样 的 > 个 
区 组 总 共有 r(&E 一 1) 个 单元 . 另 一 方面 ,A; 以 外 的 处 理 共 一 1 个 ,每 
个 出 现 和 次 ,故人 一 1) 个 填 满 >(R 一 1) 个 单元 ,所 以 r(R 一 1) 王 
X(t 一 1). 证 毕 . 

由 此 可 见 , 在 BIB 设计 中 只 要 0, 确定 了 , 则 > 与 人 就 确 
定 了 . 

在 BIB 设计 中 , 通 稼 写 出 四 个 参数 (如 2, ,rr). 


例 4.2 BIB 设 计 (3,3,2,2). 





FL 日 


| 全 < 
葡 
sw 


人 X 义 
汉 义 
C 当 义 
人 vvV 电 FOOD T 人 -上 人 THH 2 FL TT 上 人 人- 疡 ATH 4 C FDI TIT 4 全 
\ 明 人 炙 自 手 志 上 上 上 攻 二 从? 忆 和 < 用 由 芒 负 多 二 人 条 c 志 册 葬 所 


处 理 吾 ,C). 
例 4.3 BIB 设 计 (4,6,2,3). 





给 定 参 数 ti,p,& ,怎样 进行 BIB 设计 ? 现代 已 有 大 量 研 究 . 构 
造 理论 属于 组 合 数学 的 范围 ,读者 可 从 L5j 或 L7] 中 查 到 试验 工作 
中 用 到 的 设计 . 要 注意 的 是 ,并 不 是 对 所 有 的 厂 0,&,BIB 设计 都 


是 -要 La 号 六 < 咱 和 < 全 二 Po 


存在 . 
BIB 设计 不 是 正 交 设 计 . 我 们 用 1,2,… 汪 表示 上 个 处 理 , 用 
矩阵 (> ),xs 表 示 BIB 设计 ,这 里 

“”_ 11， 当 处 理 i 在 区 组 7 中 出 现 

”Lo， 理 则 


不 难看 出 
1 用 4 
>》 se (处 理 的 重复 数 ) 
产 1 
[ 
区 而 一 &_ (区 组 大 小 
克 ] 
二 0A， (相遇 数 ) ” 当 ; 坟 ) 
>》 172 人 (人 4. ]) 
/=] Lr， 习 1: 一 7 
瑾 在 来 介绍 PTR 设计 下 的 综 计 耸 本 
世人 住处 久 5 末 DLPD 了 芝 直 下 2 纪 计 人 人 ， 
令 万 一 1 7 ) :7 一 1 ， 当 荆 7 厂 时 ,用 yi 表示 区 组 / 里 处 
TD 。，。 澡 二 产 -上册 上 十 2 二 一 了 OA 7 mm 上 八 了 人 TH 和 一 一 一 一 二 下 
芋 7 间 / 忆 日 JJ 全 认 有 \ 台 里 /。 失 几 限 十 有 有 放 订 可/ 吹 居 和 福 


wa 28-。 


为 了 找 出 AQiy 记 的 最 小 二 乘 估计 / ai 人 ,我 们 采用 拉 格 节 
。 3 了 J0 。 


C 一 > ， (35 AL 0Qi 7 十 241 十 4 8 
] ] 


(zi JE 了 
解 方程 组 : 
[aQ_， 
1 (EL32 上 ) 
(7 一 1],2，…，0) 
C 及) 
和 
2vu 一 2B 一 0 
1 
从 (4. 2) 知 
> 一 人 = 一 0 
(iD 四 ED 
CN 等 于 了 中 元 素 个 数 , 即 数据 {yz } 的 个 数 ), 故 
2= 工 多 = 也 (全 部 数据 的 平均 值 ) 
人 V (i 帮 后 


从 (4.3) 和 (4. 4) 知 


p 
A ， 一 3 一 一 Jov 一 一 Y 34] .用 .一 -1)1， 
1 “站 7 《区 ( “1 人 
J 一 ] 


上 ff 站 LA J 
1 一 ] 
WE 
Jj 全 二 yi。 LA .YY 7 。 。 1 Li -77 
Ji 站 ED zi: (zi JE 
1 AmN\-hAREou DT -tv 工 m 和 昌 
\ 和 和 二。UJ/ITNDJ IAA ZL 小 / 训 4 计 
AI 一 1 .. 一 7 
7Y4 请 \ 一 THE JU 局 二 | 
\+. 7 而 刘 JJ) 水 个 H 人 1 
1 一 有 一双 
fiArh4 mnNTE TH DDN 厂 呈 
AAA\d。.。 DID 人 
到 一 一 


人 人》 1251 有 ， 一 有 rr /大 1 


7 一 ] 


ARyi. 一 /天 一 六 ci; 一 玉 


AAA 
上 由 > 
业 


〈4. 


(4. 


一、 
> 
三 


(4. 


(4. 


〈4. 


C- 
\ 


4) 


D ) 


> 
\- 


7 ) 


8 ) 


9 ) 


(4. 10) 


4 
1 
\M 


从 (4.7) 及 (4. 9) 知 
> ny 1 大 1 & ma 记 (mm )a， 


了 区 人 1 
一 Ary.. 一 ?KAN 


1 1 


从 (4. 10) 的 两 端 分 别 减 去 (4. 11) 式 的 两 端 ,并 注意 (4. 1) 有 


As 


= 二 ( 刀 ， 一 22 (人 一] ，……，) 《4. 12 ) 
从 (4.7) 和 (4. 9) 得 
房 = 二 (yy 四 17oci) 一 隐 ， (7 一 1，……，p0) 
为 了 检验 不 同 处 理 对 于 指标 是 否 有 不 同 影响 ,应 检验 下 列 


万 。 人 


采用 统计 量 
二 《4. 13) 
oOTT 上 上 / 
其 中 

d 尼 上 ] z 2 

Da 一 站 2 (> 本 二 5 
We 7 有 1 4A\ 
等 ) (4. 14) 


d 
S. 一 >》，(yj 一 .)2 一 So 一 下 >》， (本 一 .) (4. 15) 
一 


二 
9 
村 上 让 明和 傅 和 君 171 在 媚 下 太 人 目 由 度 为 ; 一 1 pp 一 
J 人 了 人 2 到 月 LO 人 DJ 人 0 9 人 外 有 下放 二 


一 5 十 1 的 分 布 . 给 定 显著 性 水 平 c, 查 下 分 布 表 得 临界 值 下 
当下 >Fo 时 拒绝 瓦 。, 即 认为 不 同 处 理 对 指标 的 影响 有 差异 . 
。 3718 。 


例 4.4 某 化 工 产 品 生 产 过 程 的 反应 时 间 依 赖 于 所 用 催化 剂 


的 种 类 请 计 试 验 引 4 种 催 他 剂 的 作用 
的 种 类 ,和布 望 通 过 试验 比较 4 站 任 FLIRJTF 人 站， 考虑 到 原料 的 老 


本 决定 将 原料 批 取 作 区 组 因素 . 但 因 只 


从 
下 一 TV 口 有 和 QQ fi 7 -1T 1 一己 了 了 人 一 一 一 


批 原 原料 , 而 每 批 原料 只 够 3 种 催化 剂 做 试验 , 故 只 能 使 用 不 完 


3,4 表示 ; 二 :0 一 4, 四 批 原 料 分 别 用 1,2,3,4 和 


人 本 2 9 人 ” 竖 ” 了 ”人 可 


& 一 3， 此 时 的 一 种 BIB 设计 为 (4,4,3，,3)， 


区 组 
] 2 3 4 

处 理 ~、 
- 久 人 久 六 





1 
2 X X X 
3 X X X 
4 X X X 
(含义 是 区 组 1 包含 处 理 1,2,4，, 即 第 一 批 原料 分 别 用 第 1,2,4 种 
催化 剂 进行 试验 ,其余 类 推 ) 
试验 结果 见 下 表 ( 单 位 :分 ) 





处 理 SS 
1 73 74 71 218 
2 75 67 72 214 
3 | 73 75 68 216 
4 75 72 75 222 
和 y ,， 221 224 207 218 y. .一 870 


> mb /二 sr Ra ZN 时 >L 从 KK4 12)》 知 
区 四 种 催化 刑 的 将 应 分 别 为 al ,az yas ya4， 从 (4. 12) 知 
4 


| 本 < 
一 于 (32 一 之 2) (一 1,2，3，4) 


竹 古 


al 3 中 罗兰 二 
1r3 1 
az 一 一 L3y 2 一 〈y. 十 ys 十 y) 一 一 去 
8 8 
EL 4 
os 一 言 L32s- 人 
-一 20 
仅 4 8 
TD PCAA 1 工 H AU AT 阅 IC 上 2T EI 人 一 了 一 ”十 人 TAI 、 门 
中 帮 芭 /六 史上 和 放屁 必 六 必 庆 网 上 晤 限 庆 ， 凡人 忆 拟 | 取 
丽 。 :ai 一 ao 一 aa 一 as 
可 采用 统计 量 (4. 13). 在 互 , 下 统计 量 服 从 自由 度 为 3,5 的 节 
分 布 . 从 (4. 14) 知 S.=22.75, 从 (4.15) 知 9 一 3.25， 于 是 
厂 一 22. 7573 _11 67 
3. 25/5 


行 显著 性 水 平 c 二 0. 05, 查 分 布 表 知 临界 值 Fo 一 5. 41, 于 
是 应 拒绝 五 

故 催化 剂 的 种 类 对 反应 时 间 有 显著 性 影响 ,采用 第 1 种 俊 
剂 反应 时 间 确 实 最 短 . 





1 
每 日 次 品 率 (百分数 ). 





日 


we 


4 6.1 5. 7 5.4 全 6. 4 
A; 4.5 4.8 4.8 5.1 5. 6 


必 
全 
Oo 
] 
心 | ? 
-| 邢 
医 
( 串 ) 
时 


有 无 显著 性 差异 ? (显著 性 水 平 三 0. 05) 
. 为 了 了 试制 _- 种 化 工 产品 . 在 三 种 不 同 温度 .四 种 不 同 压 力 下 做 试验 ， 


一 水 平 组 合 重复 两 次 ,得 产品 的 收 率 数 据 如 下 (2% ): 


压 力 
1 2 3 4 


《52，57) (42，45) (41，45) 《48 ，45 ) 
(50，52) 《47，45) 《47，48) 《53，50) 


《63，58) 《54，59) 〈57，60) 《〈53，59) 





问 : 温 站 与 压力 的 交互 作用 中 哪些 对 收 率 有 显著 影响 ? 〈 显 车 性 
水 平 c 一 0.0 


3. 在 实际 和 进行 方差 分 析 的 计算 时 为 了 计算 的 方便 , 遂 常 对 观测 数据 先 


作 一 线性 变换 ， 以 单 因 素 方差 分 析 为 例 , 令 z 一 (w 一 c)/d ,其 中 c,d 是 固 


| 一 Am  ” 扩 AS L CCT LJ UWAIE 例 , 令 


定常 数 (ds 扩 0) ,试用 zv 表示 出 单 因 和 聂 的 方差 分 析 表 . 

4。 在 单 因 素 方 差分 析 中 , 寿 各 水 平 下 的 试验 重复 数 不 相 等 ， 即 有 观测 值 
yj (一 ,2, 57 一 1, 2 这 里 是 水 平 个 数 ,s 之 2， ”~ 是 水 平 ;的 重复 次 
数 ,”~, 之 1). 这 里 

9 全 大 全 

(ez } 相互 独 立 同 分 布 ,ev 一 NO,o) (co 未 知 ). 
问 :在 此 情形 下 如 何 检验 瓦 。:m 三 1 一 … 一 人 

5. 在 &xA& 拉 丁 方 设计 中 , 设 第 : 行 第 7 列 施加 处 理 ! 得 到 的 观测 值 为 
yz ， 数 学 模型 为 

5 ee 3 ARA 2 ，… 


= 


RN 


t 一 】 ) 一 ] 


(注意 给 定 拉丁 方 设计 后 ,由 :7 唯一 确定 ， /一 /(G,7)). 


试 证明 下 列 恒 等 式 
炎 炎 已 上 
> > (yo 一 刀 2 一 下 >， ( 帮 . 一 刀 2 十 必 >》， (7 一刀); 
:一 1 了 一 1 :一 1 7 
Re 
上 2 一 玉 十 训 2Ooo 一头 一 下 


2 
并 用 上 述 这 些 平 方 和 列 出 拉丁 方 的 方差 分 析 表 . 
6. 在 冲天 炉 降 低 焦 比 的 试验 中 ,考察 的 指标 是 铁水 温度 . 试验 目的 古 


十 EI - 记 大 二 -上 万 -HI 人 一 


提高 铁水 温度 ,降低 焦炭 的 用 量 . 考察 底 焦 高 度 (m)、 每 批 焦 比 、 风 小 


(mmHg) 与 风 吡 (%) 这 四 个 因素 对 铁水 温度 的 影响 . 选 出 的 四 个 因素 都 者 





察 三 个 水 平 , 即 
ss 因 吉 | 
每 批 焦 比 风 压 风 吡 底 焦 高 度 
水 平 
1 水 平 180 1.1 1]. 2 
2 水 平 ] : 19 240 0. 78 让 
3 水 平 1 : 15 210 0. 89 1. 4 


将 这 四 个 因素 依次 放 在 工 ;(34) 的 第 1,2,3,4 列 上 ,就 可 得 到 试验 计划 . 现 将 
试验 计划 及 按 计 划 试 验 后 得 到 的 数据 (铁水 温度 (CC )) 列 表 如 下 : 





试 对 上 述 试验 数据 进行 分 析 . 





7. 为 了 考察 四 个 因素 A,B,C, 了 对 指标 > 的 影响 . 每 个 因素 取 两 个 水 
平 ( 分 别 用 4 ,4 ,Bl ，,B: ,CC ，Di,D: 表示 ), 将 4A,B,C,D 放 在 正 交 表 
Las(2 ) 的 第 1,2,4,5 列 上 ,就 可 得 到 试验 计划 . 每 个 试验 条 件 下 做 两 次 试 
验 . 现 将 试验 计划 及 试验 得 到 的 数据 列 在 下 表 : 
列 号 人 A 刀 CC DT 
行 号 ] 2 3 4 5 6 7 
1 1 1 1 1 7 9 
2 | 1 1 2 2 10 1 
3 ] 2 1 2 9 ， 10 
4 1 2 2 1 12 13 
5 2 1 1 1 9 10 
6 2 1 2 2 12 11 
7 2 2 1 2 11 11 
8 2 2 2 1 15 16 








试 对 数据 进行 统计 分 析 ( 和 希望 提高 指标 值 )， 
8. 设 4=(5) 是 L 2 ) 型 正 交 表 且 2 关 2， 和 2 寺 ]1， 试 证 明寺 必 是 4 的 
倍数 . 


交 表 . 
| 当心 一 ] 
0 当 ) 一 2 
人 一 (A，) 
f 1 的 
攻 4 4 
[ 
0 


试 证 明 :(1) M 是 工 x(2” ) 型 正 交 表 ; 


相 


《2) 试 构造 出 一 张 Lis(2 ) 型 正 交 表 . 


1 放 A=(1 有 且 JJ am 得 太志 
了 NA/ ee 及 这 《用 NI 7 AL LN 7 工 -_XvTS9 
全 当 ), 一 ] 
1 这 3， 二 
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(1) 试 证 明 M 是 工 :, (3 ) 型 正 交 表 ; 
(2) 试 构造 出 一 张 Lz (33) 型 正 交 表 
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第 六 章 ” 序 员 分 析 初 步 


大 家 知道 ,统计 学 里 最 本 的 概念 是 总 全 与 富 


三 它 的 特性 
[改天 [二 AM 仆 和 闪 J II 志 JTJ 


4 
本 则 是 由 总 体 中 抽取 的 (或 观测 到 的 7) 各 干 个 个 体 ( 
它 是 由 一 一 组 随机 变量 (向 量 ) 来 刻画 ,样本 中 所 : y 
做 样本 量 . 统计 学 的 基本 任务 是 通过 样本 来 推测 或 


ni gog 玉 2 忆 门生 冯 


性 .一 个 很 基本 的 问题 是 :样本 量 要 取 多 大 ? 当然 样本 量 越 大 ， 对 
总 体 的 了 解 就 越 多 ,因此 对 总 体 作 出 的 推断 也 就 越 可 靠 . 但 是 抽 
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禅 ( 或 进行 观测 ) 是 需要 费用 的 ,抽样 量 越 大 ,耗费 就 越 大 ,合理 的 
提 法 是 ,在 保证 所 得 结论 有 足够 可 靠 性 的 前 提 下 ,应 使 得 抽样 量 起 
小 越 好 .通常 的 统计 方法 都 是 在 抽样 之 前 预先 给 定 抽样 量 的 大 
小 ,实践 表明 ,这 种 固定 样本 量 的 方法 能 解决 很 多 问题 ,但 在 有 些 
情况 下 使 用 这 种 方法 导致 不 必要 的 浪费 , 还 存在 这 样 的 情况 :使 
用 固定 样本 量 方法 (无 论 样本 量 多 大 ) ,根本 不 能 解决 问题 . 请 看 
下 列 例子 ， 

例 1. 1( 单 式 抽样 方案 ) 设 有 一 批 产 品 ( 共 N 件 ,N 很 大 ) 需 
经 验收 检验 . 每 个 产品 经 过 检验 可 判定 为 合格 还 是 不 合格 .最 简 
单 的 验收 方案 是 选 定 两 个 整数 >c0, 从 该 批 产 品 中 随机 抽取 
件 , 如 果 这 半 件 中 所 省 的 不 合格 品 件数 4 之 c, 则 拒 收 该 批 产 品 ;车 
4 入 c, 则 接收 该 批 产 品 . 很 明显 ,这 个 验收 方案 的 样本 量 ( 抽 样 量 ) 


国定 的 囊 数 六 人 县 在 抽样 的 过程 中 ,如 果 未 抽 到 ， 件 就 六 抽 到 | 
是 固定 的 整数 1 过 自任 扫 人 件 虽 过 任 下 ， 衣 不 不 所 于 1 下 员 玫 捧 寺 ] 


了 c 十 1 个 不 合格 品 ,就 没有 必要 再 往 下 抽样 ， 换 句 话 说 ,在 有 些 


9。 LDO 。 


情况 下 事先 固定 样本 量 要 造成 浪费 , 这 就 启示 我 们 :应 根据 抽样 
过 程 中 出 现 的 情况 来 决定 抽样 量 , 

例 1.2 研究 一 枚 不 匀称 的 硬币 . 我 们 把 有 币值 的 一 面 叫 正 
面 , 另 一 面 叫 反 面 . 在 桌 上 任意 抛掷 一 次 , 问 : 正 面 朝 上 的 概率 是 


否 大 于 二 ? 我 们 可 以 用 随机 变量 X 刻画 这 枚 硬币 ， 当 正面 朝 上 时 ， 


X 一 13; 反 面 朝 上 时 X 一 0， 记 zt 一 P(X 王 1). 当然 0 和 2<1. 上 述 问 题 


可 化 为 检验 零 假设 瑟 :0<p< 了 | [ 备 择 假设 是 且 ， 于 <<1). 车 


拒绝 于 , 则 表明 正面 朝 上 的 概率 大 于 二 ;车 接受 万 , 则 表明 正面 


AAA 证 目 .名 7 征 
件 及 征 付 羽 出 


检验 法 使 得 犯 丙 类 错误 的 概率 都 一 致 小 于 c 呢 ? 可 以 证 明 ,这 个 


问题 的 答案 是 否定 的 ,也 就 是 说 ,无 论 预 先 固定 的 样本 量 有 多 大 ， 
也 无 济 于 事 . 


LI 


实际 上 ，, 设 Al , 入， 9 , 入， 十 入 的 样本 , WW 是 样本 量 等 于 ? 的 


否定 域 且 
SUDP 己 ((Ai NE 到 ) 和 过 wa 


0<p< 广 
(这 里 P,(A) 表 示 参 数 是 巡 时 事件 A 的 概率 ). 
因为 
P,((X wy,X)E 故 ) 
一 2 六 3 (1 一 用 于 3 
是 之 的 连续 上 盟 数 (注意 ， CC …,X.) 的 可 能 值 共有 2” 个 ), 于 是 
lim PC ,XD)E 卫 一 lim PCCXX)E 仙 *) 
六 | 


1 一 zx 之 本 > 


这 里 丈 " 是 允 的 余 集 ， 故 采用 否定 域 驳 犯 第 二 类 错误 的 概率 不 


TDK 1TrT 一 一 上 一 一 


能 一 臻 地 不 大 于 wa， 


, 问 :/ 是 否 有 咯 固定 样本 量 的 置信 区 间 [o ( (XXX (XI 
Ma y, 区 间 宽 度 不 超过 工 ?” 可 以 证 明 , 这 个 问题 


me 人 as ne 覃 7 ad 了 了 wa 品 L，A 9 


的 答案 是 否定 的 . 也 就 是 说 ,无 论 固 定 的 样本 量 多 大 ,不 存在 固定 
窒 放 的 置信 区 间 ( 详 由 3). 


LI 二 门人 一 八方 -AL 与 


上 述 三 个 例子 是 有 代表 性 的 ,表明 了 固定 样本 量 方法 的 局 限 


性 第 一 个 例子 表明 国定 样本 量 方 法 有 时 效率 不 高 饮 一 二 个 
I 工 。 略 ZJ 全力 时 直人 人 休 星 几 人 人 月 有 网 包 -小 阿 ， 和 一 人 一 | 


例子 表明 固定 样本 量 方法 有 时 无 能 为 力 .统计 学 发 展 史上 的 一 
个 重要 里 程 碑 就 是 序 贯 方法 的 出 现 ， 人 们 在 20 世纪 40 年 代 普 
遍 认 识 到 样本 量 不 必 有 预先 固定 ,可 以 根据 抽样 (或 观测 ) 过 程 出 
现 的 情况 来 决定 何 时 停止 抽样 (或 观测 ) ,也 就 是 说 样本 量 是 一 
个 随机 变量 ,这 样 得 到 的 样本 是 一 个 一 个 地 逐次 得 到 的 ,叫做 序 
贯 样本 . 可 以 证 明 , 在 例 1. 2 中 存在 基于 序 贰 样本 的 检验 方法 ， 
其 两 类 错误 概率 均一 致 不 超过 ,在 例 1. 3 中 存在 基于 序 贯 样本 
的 固定 宽度 的 置信 区 间 . 

序 贯 分 析 ( 或 者 说 统计 中 的 序 贯 方法 ) 正 是 研究 如 何 得 到 和 
和 用 记 黄 样 本 进行 统计 推 基 ( 或 选择 的 统计 学 分 支 在 假设 检 


人 (> 2 下 Ri AOL 上 炎 1YyhhHR HH 本- 革 /一 上 
验 、 参数 估计 及 更 一 及 有 JJ 直人 有 且 二 ? 门 "页 旋 岂 AJ 般 有 


两 个 组 成 部 分 (两 个 要 素 )， 停止 法 则 包 与 判决 法 则 . 停止 法 则 告 


一 A 一 YA VE 一 7 一 be 上 下 上 了 工 口 一 站 /上 


诉 我 们 ,在 对 总 体 进 行 逐 次 观测 (或 抽样 ) 的 过 程 中 何 时 停止 下 
来 ;判决 法 则 则 告诉 我 们 ,根据 停止 时 得 到 的 全 部 数据 ( 序 贯 样 
接 及 


“和 章 和 ”一 
| 


或 拒绝 一 个 假设 ,估计 


和 站， 主 一 上 交 地 和。 


本 ) 对 总 体 应 如 何 作 出 推断 或 选择 ( 


汶 


贝 有 些 统计 问题 里 ( 见 》4) 不 明确 提出 停止 法 则 ,允许 抽样 (或 观测 } 无 限 进 行 
下 去 ,而 每 次 (或 每 步 ) 如 何 抽样 (或 观测 ) 却 需要 根据 在 此 之 前 得 到 的 全 部 数据 才能 确 
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定 . 这 种 递 推 方法 也 属于 序 贯 分 析 的 范围 . 我 们 可 以 这 样 设 想 ， 虽然 递 推 过 程 可 以 无 
限 进 行 下 去 ， 在 实际 使 用 时 也 是 进行 到 一 定 阶段 (例如 估计 参数 时 误差 足够 小 ) 就 停 下 
来 ,因而 还 是 有 一 个 停止 法 则 在 起 作用 ,不 过 未 明确 提出 罢了 . 


。327 。 


参数 等 等 ). 


数学 上 如 何 描述 停止 法 则 与 判别 法 则 呢 ? 停止 法 则 的 定义 如 
下 : 设 Xi ,X ，… 是 狐 立 同 分 布 的 随机 变量 列 (X, 与 总 体 X 有 相 
闻 的 分 布 ). 称 随 机 变量 r* 是 停止 法 由 只 取 旧 





可 取 值 cc) ,而 且 r 振 0 ,或 r*1, 对 一 切 ” 字 1, 存 在 集合 中 (Borel 
集 y 使 得 
1 -< 一 ，\ 1 了 WA 一 王 | (1 1 
iT < 1)/ 一 人 AI An 人 GD/ 〈(]. ) 
《1.1) 式 的 直观 意义 是 :rz 是 否 大 于 ?” 仅 由 观测 值 Xi，…，X， 
和 1 人 奸 万 Yu 一人 > 时 


来 确定 ,而 与 尚未 观测 的 开 ，， X,+ 无关. 这 表明 停止 法 则 旋 
是 不 依赖 于 将 来 的 随机 变量 . 当 +t+ 研 0 时 ,表示 不 进行 任何 观测 


(或 抽样 ). 


例 1. 4 届 Xi ,X，，… 是 随机 变量 列 ,B 是 直线 上 的 集合 
(Borel 集 ) ， 
ri 一 inf{mz:72 1,，XE 了 B) 
( 当 不 存在 ”使 得 X,E 如 时 规定 ri 三 ce)， 
r 一 inf{(2:7 之 1， 入 HiE， 
( 当 不 存在 > 使 得 XeE 甩 本 则 对 一 切 ”之 1， 
| 
/ -一 人 f 物 区  ， / 一 1 7 E ID 1 
位 委 72 二 襄 (X ; 蕊 1/ \ 广 2 人 LS 已/ 
zi 一 ] 1 一 】 
可 见 rm 是 停止 法 则 ,r 一 般 不 是 停止 法 则 . 
称 停 止 法 则 * 是 封 团 的 , 若 它 是 有 限 的 , 即 
忆 Cr < co) 一 
人 J 保 止 法 则 ， 不 过 有 时 不 封闭 的 (叫做 开放 
-证 -一 hi 和 人 人 ,LEn 二 rz -人 旦 广 于 和 上 3h 
JI 9 人 JE 放 1 凡人 人 RHLSI AI 人 人 下 | 上 月 /全 个 车 
特殊 情形 
ar wm PT Ar | nr Ac TarT、 
卫 上 近 久 世人 忆 卫 上 正 肌 II 加 行 " 风 7 
攻 梓 描述 判决 法 则 呢 ? 本 集合 4 
(叫做 行动 空间 ),A 中 的 元 素 叫 做 “行动 > .所 谓 判 决 法 则 ，, 疙 是 


取 值 于 空间 A 的 映射 ZL=dCX，…，X-)， 换 句 话说 ,判决 法 则 < 


-AH -iT IF -PE 上 X) 所 应 选择 什么 样 的 
告诉 我 们 : 在 得 到 序 贯 样本 (XI ，… ” Ar) 有 JE 全 仆 人 公 和 件 肿 J 
“行动 2. 
停止 法 则 rz 与 判决 法 则 & 合 在 一 起 构成 序 贯 方法 A, 记 
人 一 (人 . 了 


读者 在 这 里 可 能 感到 停止 法 则 和 判决 法 则 的 定义 过 于 抽象 ， 
As 


忆 面 AAA2 的 上 习 就 不 难 理解 和 掌握 这 两 个 概念 
/中 晤 2 了 入 亿 狂 址 用人 有 二 过 站 和 必 ， 


假 变 检验 力 是 一 种 两 判决 问题 ,即行 动 空间 A 由 两 个 元 素 


了 了 人 证 2 2 LE 
组 成 ,A=(ai ,aa ) ai 理解 为 接 党 假设 人 人 11 9C2 理解 为 技 党 假设 瑟 ， 


(五 : 是 互 : 的 备 择 假设 ). 》2 中 介绍 序 贯 概率 比 检验 ,这 是 最 重 
要 的 序 贯 检验 法 . 》 3 中 介绍 序 贯 估计 和 随机 通 近 , 我 们 的 介绍 
是 和 人 门 性 质 的 ,更 全 面 . 更 系统 的 论述 要 用 到 很 多 测度 论 和 现代 概 
率 论 知识 ,读者 对 此 如 有 兴趣 可 参阅 18 . 


$ 2 序 贯 概率 比 检 验 (SPRT) 


最 基本 的 序 贯 方法 是 序 贯 分 析 芮 基 人 A. Wald 于 1943 一 
1945 年 间 提出 的 序 贯 概率 比 检验 .这 是 适应 第 二 次 世界 大 战 期 
间 美 国 军 火 生产 中 质量 检验 工作 的 需要 而 创造 出 来 的 . 

设 X 的 分 布 密度 (或 概率 函数 ) 是 广 (z) 或 户 (z), 到 底 是 蛙 
一 个 ? 不 知道 . 我 们 来 检验 假设 瑟 ; : 几 是 真正 的 分 布 密度 (概率 
果 数 )， 对 立 假设 是 妃 : : 户 是 真正 的 分 布 密度 (概率 函数 )， 

对 和 进行 观测 得 到 Xi ,X:,…, 它 们 是 独立 同 分 布 的 ,共同 的 


分 布 密度 (或 概率 函数 ) 是 广 或 万 


TAR IT AD 下 


为 了 检验 互 ， ,考虑 似 然 比 统 计量 : 


1 =- 开 户 (XDATITACX (mr1) (2.1) 


在 这 里 我 们 采用 通 党 季 的 习惯 : 随机 变量 与 随机 变量 的 观测 值 在 记 
号 上 不 加 区 别 . Xi ，…X,， 既 代表 半 个 随机 变量 又 代表 这 交 个 随 


。 3249 。 


机 变量 的 观测 值 ( 样 本 值 ). 


-mm BEHH Te .一 一 AAA ~ > 人 本 已 广 旭 万 上 了 上 吴 -hh Am 站 庆 下 T TY 一 | -0 


XJ 丰 4 何 于 7 At 有 人 1 9 人 nr 人 疏 逢 天 :AND 一 了 十 ， 
最 好 的 检验 法 是 似 然 比 检验 , 即 找 出 临界 值 C, 当 >C 时 拒绝 
HL ; 当 )<C 时 接受 玉 ,，A. Wald 对 此 方法 进行 了 重大 改进 
他 的 基本 思想 是 ; 当 ), 很 大 时 拒绝 五 , 当 ) 很 小 时 接受 五 , 当 


3 代 大 时 拒绝 五 


,不 太 大 、 岂 不 太 小 时 就 不 忙 做 结论 而 再 观测 (抽样 ) 一 次 ， 往 下 
研究 1 ; ,直到 某 一 步 似 然 比 足 够 大 或 足够 小 为 止 ， 确切 地 说 


Pi LU An 十 1 >》 二 VS EL 人 UL 一 二 LO AAA JIL。 5 本 ”AL MALL 9 


给 定 两 个 稼 数 4A,B(0<A4A<1<B<c),Waid 提出 的 检验 法 的 


和 放生 本 县 . 语 入 是 第 一 次 观测 得 双 | 的 值 计算 似 然 比 1 站 
六 此 定 和 还: 以 人 征 M 放 1 八 亿 认 全 二 有 JJ 直 ， 天 j 纵 ?LU 人 IN-A 刀 


(2.1)) ,如 果 

41 之 吕 
则 停止 观测 并 拒绝 假设 互 ; ;如 果 

1 <A 
则 停止 观测 并 接受 假设 五 ; :如果 

4 一 :< 
则 进行 第 二 次 观测 ,得 观测 值 X, ,计算 似 然 比 ;( 见 (2.1)), 如 果 
;之 再 

则 俺 止 观测 并 拒绝 互 ; ;如 果 


有 <Az<< 吕 


\ 慎 4 一 一 yir dd 4 县 JI 人 ES 7 mh 有 
则 进行 第 三 -TAUt 坟 ， ?可 UL 全 3 站 人 上 LE 9 人 HH 


8 果 ; 
观测 不 能 做 出 停止 观测 并 拒绝 或 接受 BE 的 决定 , 则 进行 第 ”次 
二 并 


器 一 Fi VE At 世 帮 AAA 放 、 Ai 


观测 ,得 观测 值 X, 并 计算 似 然 比 人 如果) 之 中, 则 停止 观测 
拒绝 互 ; ;如 果 ) 迄 A， 则 停止 观测 并 接受 万 3 如 采 4A< < 有, 则 


进行 第 十 1 次 观测 ,得 观测 值 Xi ……: 
定义 2.1 上 述 检验 法 叫做 序 贯 概率 比 检验 (SPRT) , 简 记 为 


一 用 一 ra 一。 ni 


SCA,B). 它 的 停止 法 则 是 
一 一 inf{(2:72 之 1， 1 GE (AB)， (2. 2) 


(在 对 一 切 7 之 1 ， 人 和 (4A,) , 则 规定 r 一 co ) ,判决 法 则 是 
| 万 ; ， 1 有 之 如 
| 接受 机， 当 )…<A 


从 SC4A,B) 的 定义 看 出 ,最 要 紧 的 是 找 出 停止 法 则 的 具体 表 

例 2.1 伯 努 利 分 布 情形 . 

设 X 取 值 0 或 1,P(CX=1) 一 5 一 1 一 P(X=0)，0<p<1， 故 
X 的 概率 函数 frz,p) 王 P(X 一 z) 一 因 (1 一 四) (z 一 0,1) ,考虑 
检验 问题 : 


(2. 3) 


局 1: : : 力 一 力 忆 : : D 一 2 


这 里 0 二 站 < 总 <1,， 力 ， 是 已 知 的 . 设 zi ,zv,，… 是 X 中 立 
一 一 一 六 有 外 六 SS AN 工 7 忆 了 本 3 


测序 列 ,从 (2. 1) 知 





= 一 | zi 加 )/ 工 了 (Ziy 力 ]) 
人 i 一 1 
2 1 二 访 。\ 7 
这 里 % 一 zi ,于 古 )ln ( 人 给 定 
0< 4 一 1 一 B, 令 
1 上 一 思 
了 = 
C 一 
二 
P1 ] 一 力 
了 有 ln 召 
上 如 1 了 一 志 
D1 ] 一 力 
qd， 一 - - 
ln 和 刀 一 In 二 了 
D1 ] 一 旋 


一 C2 十 di ，A 一 cz 十 ad 


nn 三 | ~ 有 ， 
5 一 0，dil 一 0， dz<0, 不 难看 出 An 一 总 昌 几 女 永生 yo 一 八 ， 3 


全 
天 
迄 A 的 充 要 条 件 是 ,入 A,, 故 SPRT 的 停止 法 则 是 
r 二 inft2:02 之 1，y GE (4 开 ,)) 
我 们 可 以 ) 用 图 来 表示 这 个 检验 方案 . 图 17 中 横 坐 标 表 示 抽 样 量 ， 


下 Am 人 LA 一 


纵 坐 标 是 样本 和 s, 的 值 . 当 点 (”,s) 落 在 两 条 平行 直线 之 间 时 继 


续 抽 样 (观测 ) ,和 理 则 俱 止 抽样 (观测 ) 
1 AAAJ 7 ee 


申 
饥 
人 ， 


图 17 


例 2.2 正 态 分 布 情形 . 


] 1 2 
大 (zy0) 一 -一 一 er 0 
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站 从 (2.17 


= 工 ER PCzg0) 
;一 1 


1 一 ] 


如 | 
] 0 ] 2 
二 e 王 2 2) 7 


ln 人, 一 (0， 4 一 多)， 


这 里 < 不 难 推 知 ,SCA,B) 的 停止 法 则 是 
rz 二 1 ，y， E (4,,R,) ) ,其 中 














0 导 汪 ln A 
一 0 一 山 
_ 和 十 多 ，， jn 如 
人 ， 7 7 十 了 一 人 
这 个 检验 法 可 用 图 18 表示 如 下 . 











SA 
| aaa 
二 Oi+02 了 ih 甩 | 
2 一 继续 区 域 
0 一 0 ,025 -一 
接受 万 
O) 
eu， in 4 
-一 ” 2 0-6 
图 18 


从 上 述 例子 看 出 , 序 贯 概率 比 检验 的 实施 并 不 复杂 , 它 仅 仅 依 
赖 于 事先 选 定 的 常数 A 与 吾 . 怎样 选 定 A.、B 呢 ? 这 就 需要 仔细 
研究 SPRT 的 性 质 . 很 自然 地 有 下 列 四 个 问题 :， 
4) 是 否 有 限 步 后 一 定 会 停止 观测 (抽样 )? 即 是 否 成 立 


Dr _* 一 ~ 人 一 17r :1 5 YY 有 田 D ( AN 志 示 了 这 交 直入 4 八 丰 和 二 
了 上 人 -上 9?CLj/9 过 二 ii 人 有 JJ- 庆 大 几 41H 记 有 及、 


概率 函数 ) 是 户 (z) 时 事件 A 的 概率 . 


CC7 以 有 1 恒 计算 己 ， 9 人 LI/ 。 JJA 


(3) 如 何 计算 平均 样本 量 Fr (一 1,2), 这 里 顾 ; 是 与 已; 相 
。333 。 





7 4 六 门人 门 Cr A 大 \ -大 re ED -二 人 TAG LO GDPDP 人 下 人 人 HB 
\ 和 /DLL DLL] 月 LE 二 月 几 忆 丽人 人 LU 人 上 各 女 
“ 优 2? 
AE 上 ATTT PP or 人 一 ee 人 计 二 J 上 电 入 D 记 丰 Te r 《| 
了 人 件 人 光志 关上 癌 允 风 ! 一 人 下 区 中 人 吃 辟 征 :RKRL HR 人 玖 已 
为 随机 游 动 的 人 镀 究 . 从 (2. 1) 知 
(2Z;) 
全 
方 ( 人 Ti) 
令 
二 万 (Czi) ~、1TN\ 
; 一 人 了 《7 一 上 ) 
方 (人 Zi) 


-了 三 ~ 人 ~、1A\ 人 关上 已、 
{ 荆 已、 全 1 9 之 2 9“” … 征 祖 互 独立 同 分 布 随机 变量 列 ,(2 ,7 之 1) | 


所 谓 的 随机 游 动 , 而 SCA,B) 的 停止 法 则 恰好 是 一 inf{z:x 
1,ZE(nA,ln B)}， 即 随机 沁 动 育 次 离开 区 间 \in 4A， ln 吕 ) 的 
时 刻 . 

下 面 先 对 随机 游 动 进 行 一 番 研 究 , 然 后 绸 论述 SPRT 的 
质 . 

引 理 2.1(Wald 引 理 ) 设 r* 是 随机 游 动 1Z. ,之 1 的 任 一 停 
止 时 间 , 即 对 一 切 "” 字 1, 有 Borel 集 如 , 使 得 


球 


话 


1 r m 门 1 
Ar < 77) -人 人 仆 志 1 9) “LI) ED 
看 下 和 存在 且 Fr<co, 则 有 
Ti 人 7OD 4 人 NA 
上 ZL 一 上 LI。Lr 《人 L。 生 /) 
证 明 : 记 一 max(Cz,0)，Zz 一 max( 一 Z0)， 记 
个 
5 Z0 = 一 0 
二 ， 一 [- 
IJ 
tr 之 1 二 (2 ,Li 1 ) 也; } 
十 产 了 7 人 、，\ ~… LT 一 一 ji Ar Ye DC 了 < -一 AAA 太一 人 一 3 亚 二 上 
\Z 一 2 7 到 vi 4 放 世 4 人 RU \ 辽 主 4 从小 人 昌 外 | 二 国 儿 2 9， 岂 


己 避 


二 (>D。 有 


2 一 ] 


一 >, Pr 初 .有 + 一 有 HT 严 
;一 ] 


同 理 ES 


1 一] 


由 于 BEztr BEzr 中 至 少 一 个 有 限 , 故 


引 理 2.2 设 = 是 随机 游 动 {2,,m1) 的 任 一 停止 时 间 . 若 
EZ, 一 0,，E2Z 一 co,Er<coo, 则 


下 2 了 (57 
人 &A2p0=min(Cay,p). 易 庆 
下 d 7 AP AP d AAA 只 
忆 -Ay 一 4 > )) 之 《之 ) 乙 ; 乙 壮 1 ”， 二 0 一 二 全 ) 


J 一 ] 
任意 固定 2 富 0, 易 知 


下 (Z. 一 Z. so)2 一 局 ( 》 Toy 


LA 人 
了 
1 
如 
人 y、” 请 (  、、 xz.>,，) 
1 1/ 4、 人 (rr 之 J 力 人 2 了/ 
j 一 me 十 1 m<i<jsn 
皇 二 JTJ、 上 > 县. 看 五 独立 的 共 
HI J Cr) -< 外 1 一 HH 9 HA 
Ce 2 
攻 (1 pz) 一 也 z1 取 ( 了 >) ) 
Yi 。、、 
J] 一 2 时 ” 


吧 
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7 = mrH1 
一 闻 z;( 开 (rz 人 2) 一 下 (Cr 人 AM)) (2.6) 
。 .了 3 了 JD 。 


邻 1 一 co 得 到 


T 7 7 二 N\2 一 辣 27 辣 Tv 7 人 NAN 
了 《AL 一 LAnrnj 太 ZIACT 一 了 AT 八 721)) 
lim 忆 (Z. 一 Z)2 一 0 

从? 


FEZ: 一 lim 忆 (Ze)” 
男 一 方面 ,在 (2.6) 中 令 入 = 得 兢 QZU ,一 尼 z1。 琶 (Cr 人 7). 
于 是 
下 Zr 一 lim 玉 2 。 上 (tr 人 M) 一 王 Zi 文 。 
给 定 区 间 (a,0) ， 一 cc<a<0<0<ce. 我 们 来 研究 随机 游 动 
(QZ ,7 之 1 ) 首 次 离开 区 间 (Cc po) 的 时 刻 r”, 即 


5 一 inf(2:12 之 1， CE (ay 0)) (2.7) 
引 理 2.3(Stein) 设 P(2Z=0)<1, 则 存在 和 数 M>0，r> 

0 ,使 得 
忆 ( 玉 人 >2) 和 甩 Me (一切 7) (2. 8) 


证 明 : 首 先 指出 ,存在 mm 之 1 使 得 P(|2Z.|>6 一 四) 二 p>0， 
实际 上 ,既然 P(2; 王 0)<<1, 故 有 9>0 满足 已 (|2| >8)>>0, 取 


(CC ri、 一 
本 











开 太 乙 一 a) 人 2 0，z? DO 和) 


一 [| PCzi 盖 BG) | 
=TTE Dr 一 1 NANNNrDr 一 SN Dr |~_ ~、 An 
人 JJ 二 一 冯 一 CC LI/I7T 一 LAN 人 0 9 HALA | Lam | 一 CI/ 一 忆 
1 
任 给 年 1 盖 710， 今 go=| 工 |， 1 一 (apD) 则 


六 (rz 盖 7 一 上 (LI EL 了 


< 一 DPI 一 了 7 一 了 SR 
SS L 疏 于 帮 所 09 全 2 四 和 09》 9 攻 


<P(II2Z.| 和 0 一 a， 2D 一 Q。 
| 一 Zi 过 2 一 <) 








==[ PCIZ | 委 8 一 ac)]， 
一 (1 一 加 ?和 妇 (1 一 思 )r1 
右 加 <<1 , 则 
sx ee 
己 Cr 全 1) < 一 exp| 三 jn 了 (7 二 71) 
各 少 王 , 则 
PCr” 盖 1) 一 0 (2 二 了) 
总 之 存在 M>>0， 7 盖 0 使 得 (2. 8) 成 立 . 证 毕 . 
引 理 2.4 . 设 PIZI=0)< 1, 则 PCr 天 coe) 王 1, 且 存在 和 >0 


使 得 Eexz 一 co, 从 而 ”的 一 切 阶 矩 均 有 限 . 
证 明 : 可 从 (2.8) 直 接 推 出 . 
引 理 2. S( 序 帆 分 析 基 本 恒等式 ) 车 o(i) 一 Ee2 一 co， 


em 人 


P(Z;=0)<1 且 o(b) 达 1( 对 某 个 与 , 则 
(ez… /(p(D)r ) 一 1 (2. 9) 
其 中 一 由 (2.7) 确 定 . 
证 明 : 记 闪 王 即 一 -2 一 0, 则 


7 ec 2 7 ec 
人 < 委 7) Co(bD)r | = 人 忆 


必 一 ] 











瑟 [re > 寻 1) | (2. 10) 
由 42 ZE 交 (Z ECab) 3 1 EC(a， 5) } 知 随机 变量 
本 册 
je >Db。 CDJ 0 
相互 独立 ,从 而 
F| ear， 








| 生产 
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-| 


ee 
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玫 1 之 下 ) | ， 
鸭 9] 0 


心 忌 一 外 
一 上 | > 《Ce(b) 拓 人 


再 利用 (2. we 


BE| Te sw 3 | - 直 | ee | 


| 一 一 一 一 关 、、 | 一 > NA 、 1 十 广 
另 一 方面 , 当 r 盖 2 时 ,| 2.1 委 2 一 wa 又 (Ci) 志 1, 故 


人 


严 | 7 ec 过 e | :| (和 2) 己 ( 关 > ) 0 ( co ) 
证 于 和 一 一 一 志 77 一 一 2 1 天 
本 


所 以 (2. 9) 成 立 . 证 剃 . 
对 于 随机 游 动 {2, ,之 1) ,我 们 最 关心 的 是 计算 工 =P(CZ… 委 
a) 及 Er* ,这 里 zr* 是 由 (2.7) 定 义 的 . 要 给 出 一 般 情形 二 的 精确 
计算 公式 是 困难 的 ,但 我 们 可 给 出 有 实用 价值 的 近似 公式 . 
设 P(2Z:=0)<1, 有 加 冯 0 使 得 o(bp) 一 Eeo2a 一 1, 则 有 下 列 
近似 公式 : 
一 1 


(GD) [= 《2. 1 ) 
这 里 太一 己 (L <<Q ) ; 

(2) 上 CC， 一 0 十 LO 一 D); (2. 12) 

(21 芝 FT SO 于 

\D/ 和 石 蕊 LIV /人 改 
下 T (2 了) 

0 

Fr” 二 一 -一 (2. 14) 


FZ1 
这 些 近 似 公 丈 是 皇 样 推导 出 来 的 呢 ? 由 基本 恒等式 (2. 9) 知 


Fe 和 )] ,在 集合 12.. 委 cc)》 上 用 a 作为 QZ 的 近似 值 , 在 集合 
(2 过)} 上 用 2 作为 QZ. 的 近似 值 , 于 是 有 


| evedP 十 | eaedP 二 工 
《2 生 4》 {《Lr 之 》 


riLL 日 7AOr 1T1TNA 
JU 士 J、。 了 7 。 


人 12). 再 利用 引 理 2. 1 和 引 理 2. 2 即 可 得 到 
(CC 
。338 。 


现在 利用 随机 游 动 的 性 质 导 出 SPRT 的 统计 特性 , 仍 0 用 以 


定理 2.1 对 于 ;一 1,2 均 有 
PC(r”<< co) 一 ] 
PEiexr < co (对 某 个 人 盖 0) 
忆 (zh) < oo (一 切 & 了) 


证 明 : 令 zx 王 ljnl PCzi)/ PCz) |]，2， 一 耻 ， 一 zl 十 ,十 z，， 
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朵 
六 
岩 
导 
车 
渤 
是 
< 款 
局 


ce 


下 LI < 必 | 方 (人 Z) 户 (z 和 
和 ” 二 ] 


改 P(Z, 一 0)<<1. 当 2, 是 离散 型 时 也 有 同样 的 结论 ， 利 用 引 理 
2.4 知 


1] 





Pi(r*” < co)=1 且 Piec <co ( 某 个 人 >0) 


Fi 
同 理 知 
P:(r* < 一 co)=1 且 REoexr <<co ( 某 个 人 二 0) 
天 (rz ) < co 证 毕 . 
定理 2.2，” 对 于 SCA,B) 而 言 ,有 下 列 关系 式 
ax 雪 三 (一 月 ， 8 过 4G 一 q) (2. 15) 


证 明 : 设 AP(Cz), AP(z) 是 分 布 密度 ( 当 它 们 是 概率 果 数 时 ,下 


LA， | So 


面 的 证 明 方 法 仍 有 效 ,但 要 将 积分 改 为 求 和 ), 易 知 有 集合 瓦 ， 


7 记 一 el 集 ) 使 得 fr We 人 站 . 

VDUILILL 2 II 人 可 CC 《上 1 AN-Ll 9 9? -LA AN 2 1 J 人 
4 
及 (A 之 及) 一 六 (7 -一 12， 人 ， 之 也 ) 








忆 门 《 之 妃 》 ] 








1 3 
由 J 
一 一 PC 之 及) 一 二 (1 
同 理 可 证 8p 委 A(1 一 a) 证 毕 
从 (2 15) 知 -全 过 A 一 8 过 一 人, 在 实用 上 常用 近似 公式 
1 一 w Q 
月 1 一 有 
人 二 这 Q 
公式 (2. 16) 的 重要 意义 在 于 :对 给 定 的 、p, 很 容易 确定 A、B 的 


值 , 从 而 得 到 所 要 的 SPRT. 在 确定 A、B 时 根本 不 需要 了 解 总 体 
的 分 布 类 型 是 什么 ,也 不 像 普 通 的 固定 样本 量 检 验 法 那样 要 查 痢 
界 值 表 . 


对 于 给 定 的 、B, 使 用 (2. 16) 可 得 A .了 的 近似 值 A' = 了 一， 


B=- 一 A 当然 方案 S(4" ,B* ) 的 两 类 错误 机 率 与 cp 可 能 不 














同 ,但 却 有 下 列 重 要 不 等 式 ， 
定理 了 又 给 定 wc 盖 0 ,8 OY 英 足 w 十 8 13 1 好 
AR Le 7 CH 一 ~ 性 一 上 上 7/ 2 
， 8 ,1 一 8 
A 一 一 
一 waw Q 
SC(CA*,B*) 的 两 类 詹 误 概 谈 分 别 有 是 w* 9* , 则 恒 有 
LE HA RICEC ANf” 2 AAAJ | -一 门 
关 < 一 仪 人 有 
W 
1 一 8 Se 


。 340 。 


a 十 及 和 过 a 十 B 
证 明 :从 条 件 "十 p<1 知 A" <B' ,从 定理 2. 2 知 











Re ] (1 一 序 ) 人 61: 一 疗 * ) <<， 伏 
忆 工 一 0 1 一 
有 
1 一 w js 
于 是 
(1 _ AN < rr1 nprN rr1 Non 一 pri _ ”>* 
\ 工 有/Q SCQNL 请 7， 疏 上 WA 全 NTL Q  / 
J 扣 这 两 个 厅 答 二 的 本 商人 中 HHn 组 <* 二 Ar < 一 A : 直 比 
付 人 并 人 本科 由 过 用 友人 让 山上 一 HL- 人 。 
这 个 定理 告诉 我 们 ,采用 近似 公 式 有 16) 后 ,两 类 错误 的 概率 
-~ 工 m 四 一 一 Ja _ 上 E 
< 二 人 人 HA 人 小 必 八 吕 J， 
有 Z 王 ]n | /zi)/ 广 (zi) 和 耕 有 几 天 0 满足 ER 则 从 
(2. 11) 得 到 
d Be 一 1 
二 ET (1 一 1 ,2) 


从 而 wx 三 1 一 L-: 和 0 二 厂 ; 都 可 近似 求 出 . 


下; r” 一 


BA 
pn 二- 二 G 一 Pin- 一 

下 rr 一 一 7 

已/ 
现在 问 :SPRT S(A,B) 有 何 优 和 良性? Wald Wolfowicz 
4 电 上 ak- NA 有 时 了 | -JJ JU Te 1 二 证 区 有 把 是 | 时 三 SA 有 且 反 v 4 

《1948) 证 明了 下 述 最 优 性 : 设 SC4A,B) 的 两 类 错误 概率 是 w、p， 

忆 站 十 《人 AT PE- 人 TAN 上 人 办 \ 口 E 人 出 TR 3 AHE 局 
本 量 是 r”, 则 对 任何 序 贯 检验 法 A=(r,d)， 从 > 妇 各 了 站 灾 了 外 估 


率 o ”8 满足 os 委 c,8 委 8, 就 一 定 有 Fr 之 忆 “ (一 ,2) , 换 句 话 
说 ,S(4,B) 的 平均 样本 量 达 到 最 小 . 


。34J 。 


这 是 现代 统计 学 里 最 深刻 的 定理 之 一 ,严格 证 明 相 当 难 ,读者 
可 在 L8j 中 找到 它 的 完全 证 明 . 

以 上 讨论 假设 检验 时 ,假定 总 体 的 真正 分 布 密度 (或 概率 郴 
数 ) 是 户 (z) 或 亡 (Cz) ,在 实际 问题 里 ,很 可 能 真正 的 分 布 密度 (或 
概率 函数 ) 既 不 是 户 (z) ,也 不 是 和 (Cz), 而 是 AAACz), 此 时 如 何 计 
算 SC(4A,B) 的 接受 假设 瓦 ,, 的 概率 及 平均 样本 量 呢 ? 这 个 问题 可 
以 提成 下 列 一 般 形 式 : 设 zi,zz,… 是 独立 同 分 布 的 随机 变量 列 ， 
Zi 的 分 布 密度 (或 概率 函数 ,下 同 ) 是 F(Cz,0), 其 中 0OEB,9 是 已 
知 集合 ,至 少 含 有 两 个 元 素 . 我 们 假定 不 同 的 0 对 应 不 同 的 概率 


分 布 . 研究 检验 问题 


厂 :0 一 9 万: 0O=0 (2. 17) 
CE 是 待 检验 的 假设 , H, 是 备 择 假 设 )， 我 们 使 用 SCA,B) ,其 售 
止 法 则 是 
r 一 Inti(72:7 之 1]， AGE (4A，, 甩 )) 
这 里 


四 fx:b)/ 下 三 (ZiyO0)， 7 之 上] 
给 定 be B, LO) 革 P,( 接 受 吾 )( 这 里 己 乃 是 与 AFCz,g) 相 应 的 概 


率 ) ,叫做 检验 的 操作 特性 函数 (COC 函数 ). Er 是 真正 密度 为 
Fr(Czy,0) 时 的 平均 样本 量 (ASN 函数 ). 怎样 计算 工 (0) 与 Er 呢 ? 


人 -7 AAA AZ 


八 
es 


2 二 jnlL 帮 zi Aczi0)]， Z 一 2 = >D) 
则 {Z,，x 之 1 是 己 下 的 随机 游 动 ， 设 有 jb) 立 0 满足 
1, 则 从 (2. 10) 一 (2. 13) 得 到 下 列 近 似 公 式 ， 
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甩 信 0) -一 AAA0) 


(2 看 下 2 所 0， 那么 
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严 LvAWUALII LA -人 玫 荆 LvANUAZ7iITII 
p7 一 
光 ， 1 


(3 ) 各 下 ,LA 一 0) 天 QI<co , 那 入 
人 ， 工 (O)(linA) 十 (1 一 工 (0))(ln 吕 )- 
OZ 人 


太 Z 力 ) 一 太 人 ” 
放假 议 吾 是 盖 访 ( 王 1 2, 加 < 扩 加) 对 于 检验 问题 : 


六 -> 工 了 
《II1<>I2 


我 们 采用 检验 法 SCA,B) , 它 的 停止 法 则 是 **. 我 们 来 计算 OC 


是 


函数 L(p) 王 P, (接受 媚 ) 与 ASN 函数 Er*， 这 里 P, 是 与 
卫 wm 











F(z,bp) 相 应 的 概率 ,已 , 是 相应 的 数学 期 户 
由 于 
Li 忆 十 人 一 am)ln 了 二 忆 
] 一 旋 : 
屋 jz 有 1 一 ， 
0 思 )in 本 一 阿 
忆 ,e“ 一 (] 一 未 | 三 十 力 亲 
\1 一 力 / \ 力 ; / 
可 以 证 明 存在 太志 ( 思 ) 气 0 满足 
人 FE,e 一 ] 
于 是 
RCp) 
Lp) 二 有 一 
一 丰 
奉 
AAAE -和 + 二 二 
则 


Lin4A 十 (1 一 LCp))lnB 


in 外 十 (1 一 力 )imn CN 2。 
P 1 . -一 所 


尼 r* 


看 中 01 一 0, 则 
国 LCp)Cin AD 二 HOLE B) 





中 pr ”二 旋 下 
ln 大 ) 节 加 二 ) (mn 2 
玉 pk 妃 :1 史 ] 一 - 力 
一 一 一 一 冰 人 一 ] 下 He mw mn 挛 4 Am An Amnc 了 一 一 
玉 轩 和 征 似 骨 鲍 才 , 石 ]1 一 Uo，DP2 一 LIU，Qa 一 六 一 ) UV ， 刘 了 本 
加 B8 1 一 8 ” ] 


19 且 
-一 inffz:7 人 1，s 区 (0.722 一 3.94，0.7272 十 3.94) } 


5 元 六/ 7 
1 
AR 
3 
19 


一 有 =0. 05 ,我 们 来 计算 一 下 ,为 了 达到 同样 的 cp, 园 


Je - 导 西 包 了 -全 Sr 三 
岂 人 有 JJ T 人 里 女人 八 沁 .JJ。 这 时 和 桩 本 量 肯 和 定 很 大 ,可 用 


极限 定理 来 估计 . 在 如 一 加 一 0.05 的 条 件 下 ，,s | z 近似 服从 


N(0. 052，0. 0475m) ,在 一 记 =0. 10 的 条 件 下 ,s 近似 服从 
N(0. 102，0. 092) , 找 和 和 7 满足 
344 。 


人 


生 
里 
时 


三 oo (二 >> 烛 一 0. 05， Pie{( 一 s s = 0. 05 
显然 人 和 7 应 由 下 式 确 定 : 


QQ 二 0.10) wm，1] ka 
V0. 09 


由 此 知 11=292， 人 一 0. 072， 包 是 7 一 2], 故 2221] 时 拒绝 殉 ; 9 S29g? < 
21 时 接受 妃 ,这 时 两 类 错误 概率 都 是 0. 05 ,但 样本 量 却 是 SPRT 


的 平均 样本 量 { (Erz* 十 Er ) 一 144] 的 二 倍 . 





2 轴 4 
1 
(二 ) 正 态 分 布 情形 
这 TilyZz， 是 独立 同 分 布 随机 恋 莉 列 ,zl 一 NO,1). 假设 
五 有 旦 “0 一 0 一 1.2 .0 -< 一》 对 于 检验 章 显 
1 估 EUV Wi  \( “99VI ~ 人 LU279A 人 人 J j 人 
有 :0 一 0 万 :0 一 凡 
FEFH As isyF SG A \ 了 人 的 锥 了 7ONVTI 古 ，* 
/和 人 这 二 人 JJ 六 二 6 
7 nrrrr ooyrrgr no] 其 中 
1 LLLL | II7 JJ9AA 
了 (00 辣 exp 一 到 (< 一 0 
A1 了 7 








口上 此 0 FF -2 一 1 于 上 旦 . 了 2 
喇 -AL NA FJ 40 二 9 JJ 人 UV AN 电 - 
0 一 由 2 
\ ACO) | 
人 (ee AKCD) 
1 
YI 和 下 0 十 9， 工 T FEH 大 0 上 人 HL 全 nm 
于 一 Vo0 2 J， 个 JJ 过 < 人 及 


AtO . 


已 
了 40) 二 jim 9 一 Ai 











ln 如 
im 总 一 mA 
二 
当 b 反 扫 二 生 7 全 时 ，EV2， 所 0, 故 
灰 ， L(g)ljnA 十 (1 一 工 (b))ln 如 
0C 二 1 
《0 一 小 400 十 本 《人 一 多 ) 
Je 0 一 和 下 如果 开 F 一 0，F 7 一 让 2 坟 ， 
二 VvV 9 JJ 91 人 一] 9 | NU7 Wwwli7 9 了 HA 
友 ， 关 一 《inA7(a 吕 ) 
《0 一 9) 、 
Te A_ 1 0 E 侯 虽 
0 
Q Q 
pn 十 (1 一 Pin 一 
Fo r 二 一 一 一 一 (2. 18) 
(8 -一介 
7 
(1 一 )m 了 5 十 aln = 一 全 
Er 一 站 一 一 (2. 19) 
一 一 (0D 一 有 3 
7 NU2 UV 7/ 


下 面 我 们 比较 S CPPRT 下 PIC 本 -恒信 THTA 六 
HU JR 有 JJLC 二 人工 让 人 FL 时 1 


本 量 方面 的 好 处 . 
根据 N -P 引 理 , 最 优 的 固定 样本 量 检验 是 这 样 的 ; 当 开 = 
绝 当 





二 ZX 之 C 时 拒 万 ; :0 一 , 当 工 委 C 时 接受 互 ,. 这 里 的 2,( 
] 
应 使 得 


AZ 全 (一 a， 上 0 (《Z 委 C) 一 有 


ee dz 一 从 , 则 
A， 人 元 .了 


(CC 一 0 )7 一 扩 E KGC 一 0 )7 一 玫 1 -8 





于 征 

天 
《0 上 0 7) 

站 -| 《0 一 由 ) 玫 。 

V1l | 区 二 并 | 一 天 1 





有 1 一 0 本 
B, 令 
9 
7 


从 (2. 18)、(2. 19) 得 


es 


人 
Re 


ES 上 一 a 
太一 书 ( 开 。 一 久 ，0) 
本 
-9 C CQ 
帮 2 ( 开 。 和 Ri) 


对 于 常用 的 几 个 .8, 表 2.1, 表 2.2 列 出 了 100 和 100ums 的 值 . 


后 " 哪 日 本 FF ne 重 ” 和 A 呈 嘎 人 “ 


表 2.1 1001 





从 这 两 张 表 可 看 出 ,SPRT 所 需要 的 平均 样本 量 比 固定 样本 


量 的 最 优 检 验 的 样本 量 要 小 得 多 ,使 用 前 者 平均 可 节省 样本 量 一 
半 左 右 . 
例 2. 3 六 五 一 AN(0， D ,本 0 一 0 万，， 人 0. 01 , 取 
人 
A 一 一 -一 一 人 ] 一 A 99， 这 时 ， 
1 一 ww 99 
1 六 7 二 二 
】 】 2 9 0 】 2 9 】 1 2 
项 带 过 0. 99ljn(99) 一 十 0.01in 99 9 
上 工 
2 
ms 。0.0lln(99) :十 0.99ln99 。。 
工 一 
L 
-二 扩 -YY CE FEEI ww 起  E 十 人 人 人 
个 


右 及 用 国定 样本 量 的 最 优 检 验 法 , 则 应 取 主 (天 ooi 一 
玉 。s) , 查 正 态 分 布 表 知 天 wo 一 2.3 .3 
可 见 SPRT 所 需 的 平均 样本 量 是 非 序 贯 情形 最 优 检 
41 % 
以 上 的 讨论 都 是 针对 简单 假设 和 简单 备 择 假设 进行 的 ， 这 时 


SPR 工 有 很 趟 -的 伟 占 对 于 复杂 假设 mm 2H 人 在 的 庆 母 站 
人 和 八 RU 人 本 | 区 必 ? 个 人 么 样 的 太 贯 检 


晤 己 


全 


蕊 v/ 


验 法 呢 ? 这 个 问题 现代 有 大 量 研究 ,但 未 能 彻底 解决 下 面 只 对 


岂 太 小 在 YI 人、 六 ITHH 一 一 人 上 


一 种 最 简单 的 情况 介绍 处 理 方法 . 
设 X 的 分 布 函数 是 F(z,0) ,分 布 密度 (或 概率 函数 ) 是 F(Cz， 


0), 这 里 OO， 0) 一 9, 一 co 委 b <0 委 cc， 从 定 bj <0 40EG， :一 
1 ,2 ,考虑 检验 问题 ， 


万 :0 委 0 人 万 :0 之 4 
如 何 进行 检验 ? 设 mi ,zs，… 是 X 的 观测 序列 , 仍 令 


人 ,一 T[ 丰 Cziy0 )7 ziyOl ) 
] 
取 0 天 A<1 天 了 B, 仍 采用 SCA,B), 即 停止 法 则 为 
。348 。 


r” 一 Inf{(72320 之 :1， ME (APB)) 


沁 寺 YI 
7 人 DA 全: 
了 村 ws 之 ` 品 
( 接 和 党 万 ， 当 1 科 人 人 
六 时 检验 法 GTA-PRP 右 合 纺 计 性 性 孔 ? 我 们 口 堪 虑 IFOr ON 县 
J 一 和 JJ 本 ve 帮 JAY JJ 人 -A/ 志 TiJZAZN- AAA 以 9UU7 人 
Pa AAA 有 有 了 Ar /AAA -让 ~- 主人 1 7 一 7 mA 晤 nt 上 1 ah 岂 疡 - 芭 避 十 Jr mm 一 
人 入 全 名 人 件 刀 4 人、 人 39 十 [ 媚 人 昌明 和 人 一 轧 (I 
0， 有 





其 中 
\、、_ | Z 之 0 
0 7 
和 方差 为 1 的 正 态 分 布 族 
F(z,b) 一 | -eriorode，0E (一 covco) 
wj 一 oO AL 
者 是 随机 增 的 . 
起 以 证 明 下 列 重 要 结论 ， 在 (FEGzos0) 是 随机 增 的 , 则 操作 特 
本 本 村 LO) 二 Pi( 接 受 万 ;是 0 的 不 增 函 数 . 因此 有 ~ 
P, (拒绝 BT ) 一 Py (拒绝 妃 ,) 
P, 接 受 全 (接受 五 
至 于 平均 样本 量 FEor” ,作为 0 的 萎 数 相当 复杂 . 
作为 本 节 的 末尾 ,我 们 指出 ,SPRT 虽然 在 节省 样本 量 上 有 很 


大 优越 性 ,但 样本 量 并 无 固定 的 上 界 , 这 对 实际 工作 带 来 不 便 . .30 


人 年 来 ,许多 盐 尾 型 的 序 册 检 了 验 尘 (六 时 样本 量 有 上 界 ) 受 到 广泛 的 
人 涉 ?了 儿 讽 肛 二 有 门下 位 向 位 \ 了 这 有 人 件 休 星人 荆 刘 /又 工人 有; 


重视 ,如 著名 的 美国 军用 标准 781 和 我 用 标准 899 就 是 采用 
鹤 尾 型 的 序 贯 检 验 法 . 参看 [221|. 
。349 。 


我 们 指出 ,上 述 SPRT 在 应 用 中 还 有 一 种 局 限 性 订 贯 性 太 


本 品 ?99 J 刀 上 -水 - 由 羡 二 人、 人 人 A、TT ve YA 二 vi 人 电 RIT 由 刀 7 人 人 、 人 人、 -TI Vi 


强 “一 一 样本 是 对 个 体 一 个 一 个 地 逐次 观测 得 到 的 (一 个 个 体 观 测 
完毕 才 可 能 开始 观测 下 一 个 ), 不 能 同时 进行 观测 . 对 于 那些 需要 


一 全 上 一生。 你 们 全 证 让 -和 下 生 时 是 。 必 -Im 一 一 生 一 


观测 时 间 很 人 到 个 体 观 测 值 的 实际 工作 (例如 许多 医药 疗 


效 试验 ) ;SPRT .很 难 实 葛 . 针对 这 种 情 况 , 后 来 出 现 了 多 种 新 的 
序 贯 检验 法 :成 组 序 贯 检验 (Group sequential test)4 时 间 序 贯 检 
了 人 下;j Ine Seqtentia ] faeg t) 等 ,读者 可 参阅 | 14 二 站 
< 世 4 二 ML iti CE LS t) 等 J Er LoLLI。 检 

R 序 贯 估计 ER 右 二 > 了 所 

So 厅 页 人 Rn 计 记 隐 包 地 过 


序 贯 估计 就 是 用 序 贯 贯 方法 估计 总 体 的 特性 值 (比如 估计 总 体 
所 含 的 未 知 参 数 的 值 ). 与 序 贯 检验 相 类 似 , 它 的 重要 性 也 是 在 两 
个 方面 . 一 方面 , 序 贯 估计 在 许多 情况 下 比 起 非 序 贯 估计 来 有 较 
高 的 效率 , 即 为 了 达到 同样 的 估计 精度 , 序 贯 方法 所 需 的 (平均 ) 样 
本 量 要 小 些 ; 另 一 方面 ,在 某 些 情况 下 不 存在 非 序 贯 的 估计 满足 所 
提 的 要 求 , 但 有 序 贯 估计 合乎 要 求 . 这 后 一 方面 告诉 我 们 , 序 贯 估 
计 是 不 可 少 的 . 

序 贯 估计 包含 序 贯 点 估计 与 序 贯 区 间 估 计 . 序 贯 估计 的 理论 
和 方法 从 20 世纪 50 年 代 以 来 有 很 大 发 展 ,研究 的 问题 很 多 ,方法 


志 万 一 一 二 工 1 工 0 、 人- PHI -一 he 由 Er 人 一 -二 FF 


也 多 种 多 样 , 疝 缺 乏 统一 的 方法 和 理论 . 人 我 们 不 去 对 皂 
贯 估计 作 全 面 论 述 , 只 以 正 态 分 布 均值 的 估计 问题 为 例 ,说明 某 些 
重要 的 概念 和 方法 . 
设 X 一 NGCus;o) so 都 未 知 ,X 、X, ,… 是 X 的 独立 观测 序 
列 ,我 们 来 研究 六 的 估计 问题 . 
问题 :给 定 ! 盖 0 及 7yE (0,1)，* 是 砍 . 


(XXX oz (XI，…，X2) 满 足 
0 委 zz ”01 < / 
请。 (On 妇 /和 雪 02) 之 7 (一 切 MG) 
换 句 话说 ,是 否 存 在 固定 宽度 的 置信 区 间 ( 这 里 已 . 乃 是 参数 
.350 。 


为 wa 时 的 概率 )? 


三 | 工人 


这 个 问题 的 答案 是 否定 的 ,我 们 可 以 证 明 
定理 3.1 设 X 的 分 布 密度 是 一 让 ( 4) ,其 中 wE (一 co， 
co)，,oE (0， co) 都 是 未 知 参 数 ， Xi，…X， 是 和 的 样本 . 则 对 任何 


1 及 /二 0, 不 存在 /之 长 度 不 超过 7 的 置信 区 间 ( 置 信 水 平 是 7) ， 
即 不 存在 DI( 入 1 入 )<sp(AXi， ee ,X,) 使 得 


马 


0p2 一 bl 魏 / (31 
厂 (1 和 | ai ,O，|) -之 y (一 切 MI 1) (3. 2 ) 
于 一 和 下 六 
这 里 P_ 是 分 布 密度 为 上 F { 开 一 4 时 相应 的 概 : 
一 区 一 ARG 人 一 一 上 Te LI Fo 区 于 
OO / 
3HB 3 妈 yk: 让 ra TAN 和 信友 人 伟人 县 
证 明 :这 有 pop: 满足 (3.1) ,我 们 指出 上 必 有 moc 使 得 


] 
《Ap 掏 Lo yes j) < 1 一 A| 入 本 4 


取 正 整数 N> 六 ,再 取 | 二 mp 过 …<pav 满 足 风 i 十 1 一 Hi 一 / (一 ， 
2 和 2 人 一 ]) ,于 是 集合 
全 一 (1 9 ””“” ) 2、 SCZi 和 nr 一 Ai 和 本 


(一 1,2,…,2N) 两 两 不 交 . 因 慈 
[PP (CCX ，… 人 上 人 《( 入 1 X)ES) 


人 香 本 





-人 Eee)anarr 
PR 





少 


ES (有 一 1，…7) 


ES 一 (yl yn ) (1 2) E ; 


we 
me 
到 





PC ESD) 一 PC eeyXD) ES 
< .[|TTr( 十 血 二 ATT Fl dy 
赂 IO 1 
| 站 TFT 1 CI 人 | 二 
下 | 了 0 CD 
-可 ge+wo=scooldy 
其 中 
y 王 《31 yn) 
本 ,| 
，、 百 ，， 、 
S\y7 一 | 人 yxy/ 
9 YY 1 
由 于 gsgEL: ,根据 工 ; 连续 性 知 a 一 0 时 
| gco+aw 一 scoo)lday 一 0 
见 周 民 强 编 4 实 变 函 数 ;? 第 140 页 ,北京 大 学 出 版 社 ,1985). 于 是 


卫 ER E 1) 一 由 io 人 AI 入) 和 Si) | 王 0 
CCD 


可 见 存 在 ce >0 ,对 一 | 晤 二 
人 


1 


< 一 上 
2N 


fm -~ ， 人 二 电 

| 王仁 仁 ?20 以 和 语 1 
二 ER 1 
Po ((X An) E Sa ) 安 7 


。 352 。 


} 


PC(X mw,X) E Su) 挟 交 
即 有 
Ps [18 一 避 |<< 冯 | 和 太一 ; 
更 有 


二 (Ai 的 [| m ,02 上 < YX 
这 表明 (3. 2) 不 成 立 . 


下 面 指出 ,对 于 正 态 分 布 NG,o) ,采用 C. Stein 提出 的 两 阶 
段 方法 可 得 到 / 的 固定 宽度 的 置信 区 间 ， 

从 定理 3. 1 的 证 明 过 程 看 出 ,由 于 v 可 以 任意 大 ,造成 固定 样 
本 量 方法 出 问题 如 果 “已 知 , 则 取 


7 1 1 an 、 
JI 1T 7VY 
> 二 "we 一 一 2 
| 


0 生效 2 (2 





人 

一 十 志 < 一 了) 

(3.1) 和 (3. 2) 就 满足 了 ,这 里 wx 为 N(C0,1) 的 wa 分 位 点 . 现 

在 cc 未 知 ,Stein 的 方法 是 先 取 一 个 样本 来 估计 的 值 ， 然后 再 利 

用 这 个 估计 值 确定 第 二 个 样本 量 的 大 小 ， 具体 叙述 如 下 . 
取 入 之 2, 令 工 。 


堵 么 








| (3. 3) 
L 
其 中 4 一 记 ， 上 (7 一 1) 是 2 一 1 个 自由 度 的 上 分 布 的 a 分 位 数 
辐 PD ”一 一 人 一 1 局 
亚 和 fi 工 MT /一 上 二 
1 
二 | .和 SS 一 和 jd (7 一 上 (3. 4) 
下 : A/T1 





的 长 度 等 于 (ma 一 1) 委 2&Z 王 ,我 们 将 证 明 


VET1l 
了 了 CE D=> (对 一 切 pe) 
引 理 | 对 一 切 7 之 2， 1 与 (%,， ,内 ) 是 独立 的 ,这 里 





民 一 -Or 一 去 )2 (2) 
2 


5 

之 ;i 一 LA 
& 一 1 

] 

2 一 一 (Zi 一 1/) (2 之 1]) 
Le 
则 CI 9” ”9 Cr 独立 同 分 布 , 一 N(0,1)， 令 
1 


(zu 十 … 十 zi 一 说 二 ) (一 1,2,…)7 一 1]) 


隐 ESSERE 
VzICL 十 1]) 





易 知 ，…y 独立 同 分 布 ,y ~NCD， 人 ,可 以 证 明 :对 一 切 ;之 ” 





2 

人 7 (3. 5) 

Er ae 下 CC > mm AAA 一 ] 旨 2 

圭 头 上 ， 回 息 | 2U1 十 … 十 zi)， 则 从 xz 到 
志 


t 
本 一 一 


《Zi 一 大 ; 


yl1 十 … 十 省 一 Czi 7 一 广 


盖 ] 


从 而 (3. 5) 成 立 . 由 于 ( 冯 ，…, 到 ) 只 与 了 1 ,yo_1 有 天， 而 人 


-二 只 与 y， 有 关 , 故 云 与 (中 ,, 吧 ) 相 互 独立 .证 毕 . 


: 引 理 3.2 设 = 只 取 不 小 于 mm 的 整数 值 

在 如,(Borel 集 ) 满 足 

(rz 一 1) 一 { 人 (下 到 ) 志 也 )， 

则 有 下 列 结论 : 
(1) Zr 是 /的 无 俩 估计 ; 


了 了 


2 rm TAN 

CA/ 2 LV 1] 3 
四 

《3) YYVrCZr AI 一 太 加 一 ])， 


证 明 二 一 >》， 到 (了 =。 0 


一 >, 了 (Cr 一 7) 。 了 Zu 一 1 
可 上 网 工 . 是 5 的 无 偏 估 计 . 


| 二 [ 
Te < 7Z， 0 入 


- NIP_ (rm 二 过 肖 P_ (一 由 二 
0 G /人 0 EN 
一 2 二 岂 SR 


二 (二 。 < yj) 生 (z) 
C 
其 中 EGGCz) 是 NC0,1) 的 分 布 函数 . 令 yco 得 
| 委 z 广 2(z) 


玖 二 EC: 一 /与 一 mn 相互 独立 ,从 而 


二 (去 一 咯 二 
证 毕 . 
定理 3.2 设 如 (3.3) 所 定义 江 如 (3.4) 所 定义 , 则 
六 EUE7 
Cz 一 1)d- 


(7 一 37) 


(2) 囊 ，( 却 一 /2 < (当知 之 3 时 ) 


其 中 4 一斑 ，! 一 直 :Cm 一 1) 
证 明 : 从 引 理 3. 2 知 
/| 
Te 央 | 入 于 om 一 D)= 
即 有 己 .(CuxeE D== 
| 
ee ri 
全 人 二 [二 证 毕 
Jr ss 


,用 >t 
给 定 值 的 置信 区 间 . 这 个 方法 
萝 自 有 8 人 局 也/ 挟 


制 , 当 很 大 时 , 尼 ori 6 


人 Tet Sr -二 -IT 
应 如 何 鲍 生 也 人 { 八 人 己 ! 


员 避 | 


学 者 的 研究 对 象 . 
例 3. 1 已 知 总 体 X 服 傣 NGCnpoc /99 未 知 设 /一 0. 6 ,7 一 
0. 95. 我 们 可 用 Stein 两 阶段 方法 找 出 5 的 置信 水 平 为 0.95 


度 不 超过 0. 6 的 置信 区 间 . 从 总 体 中 抽取 样本 量 关 王 21 的 样本 


(第 一 外 处 样本) 


| 和 1 人 全] 
0. 72 1.69 0.82 0.21 一 0.09 1.57 一 0. 26 
1.08 1.94 1.60 1.19 1..04，2.74 1. 45 


。 ID50 。 


0.4(/ 一 0.84 0.82 0.77 1.93 0.36 0. 上 3. 
HU AN 0 AL -上 直人 Qia 如- 二 -一 一 3 人 
由 此 算出 样本 均值 :三 0. 91 ,样本 方差 :二 0. 


Lo 975 《20 ) 一 2.086. 


取 4 一 三 一 0.3, 知 
-to 975 (21)) 一 35， 29 


阶段 应 抽取 样本 量 为 15 的 
样本 . 设 第 二 阶段 样本 如 下 : 
1.23 2.11 1.07 1.02 1.84 一 0.20 0.05 1.83 
0.46 一 0.06 0.69 2.32 1.05 0.44 0.30 
由 此 算出 总 样本 的 平均 值 必 as=0.92 及 
2 
《1 


从 (3.4) 知 冯 的 长 度 不 超过 0. 6 的 置信 区 间 为 
| 0. 92 一 0.297 ，0. 92 十 0. 297 | 


YI 
二 1 


[0. 623,1. 217] 
(置信 水 平 为 0.95). 


本 节 的 剩 下 部 分 是 讨论 一 人 入 由 丰 换 侍 计 问世 
个 ”1 人 下 JJ HR 人 了 了 忆 时 | 





《rw 上 大 二 < 六 站 1 TI -1 王 / 有 =- 生生 
而 受到 人 们 的 重视 , 现 已 形成 


一 些 简 单 而 典型 的 情况 . 
设 MGCz) 是 一 个 函数 ,一 个 常见 的 问题 是 求 方程 “MGCz) 一 o” 的 
根 . 如果 MKz) 的 表达 式 是 已 知 的 ,党 用 熟知 的 Newton-Naphson 


方法 求解 .. 在 实际 问题 中 ,往往 天 数 MGCz) 的 表达 式 不 知道 ,但 给 


和 F 和 我们 能 得 到 区 随机 恋 县 (rr 的 如 测 估 .这 四 
了 过 / 口 区 8 启 站 和 可 莹 星人 十 


开 Y(Cz) 王 MOCz)， 这 个 MGz) 叫 做 回归 函数 . 如 何 找 “MCz) 一 。 ”的 
根 或 根 的 近似 值 ? 这 是 实际 工作 中 十 分 关心 的 问题 . 


和 
3 
3 
冰 
忆 
申 


。 3527 。 


例 3.2 设 表 示 注 人 小 日 刀身 上 的 锌 检 药 物 的 剂量 ,了 Y(z) 


[时 上 让 和 疡 人 小 上 外 此 mr AN FS 
表示 当 注 人 剂量 的 药物 后 小 折 Bf 信 彤 L， 将 反应 分 成 两 类 ,一 


类 是 注入 后 一 定时 间 ( 如 24 小 时 ) 之 内 和 死亡 ,万 一 类 是 这 一 段 时 间 


本 机 


人 小 和 CC。 RhX 
(二 ， 如 果 小 日 罗 死 FE 亡 
0， 否则 
d 四 
于 是 已 Y(Cz) 一 MV MGz) 一 PIGY(z) 一 1) 表 示 平 均 死 亡 率 .所 半数 致 
死 量 工 乃 是 方程 <M(z) 一 于 ”的 根 ,这 是 医学 试验 中 很 关心 的 量 . 
如 何 求 出 工 ? 

我 们 回 到 一 般 情形 下 如 何 求解 的 问题 上 来 . 最 早 提出 、 也 是 
最 著名 的 解法 是 Robbins-Monro 方法 (简称 人 - M 方法 》, 叙 述 
如 下 : 

ee nz>1) (通常 取 ao, 一 二 ) , 先 取 初 值 x 


Zr 一 Zn 一 arr 一 a) (之 1) 
来 确定 序列 (zz 之 1) ,这 里 Y=Y(z,) 是 Y(Cz) 在 Zz 一 zs 时 的 观 
测 值 (z 这 1). 设 “M(z) 一 cx” 的 根 是 6, 可 以 证 明 ,在 一 定 条 件 下 
P(limz, 二 0 二 1， 换 句 话 说 ,只 要 浆 足 够 大 ,zw 可 作为 0 的 恨 好 


在 实际 问题 里 ,有 时 要 求 回归 函数 M(z) 的 最 大 值 点 0M(b) 一 
max AZ) )， 由 于 M(z) 未 知 , 不 能 用 通常 的 微分 法 来 解 , 又 由 于 不 
能 直接 观测 到 AM (zl) 的 近似 值 , 也 不 能 使 用 上 述 的 RR-M 方 法. 


ke ee 量 Le 2 


这 时 可 使 用 下 列 Kiefer-Wolfowicz 方法 (简称 玉 - W 方法 ,1952). 
取 定 两 个 数列 {a, }，{c, } (通常 取 w 一 一 ，c 一 二 nx] , 先 
取 初 值 zx(〈 彰 数 ) ,以 后 每 一 步 做 两 个 观测 ,用 下 列 饮 推 公 去 
十 (了 an 一 Yao) (之 了 


来 确定 序列 (z 忆 ? 7 之 1)} ,这 里 CO JJ 交 人 六、 ] 一 也 (Z， CC ) 


是 Ykz) 在 z, 十 cv，z 一 c* 处 的 观测 值 C(” 之 1)， 可 以 证 明 , 在 一 和 定 
条 件 下 ,P(limz, 一 9) 一 1, 即 只 要 充分 大 ,zx, 可 作为 M(z) 的 最 
大 值 点 0 的 良好 近似 值 . 
由 上 述 可 以 看 出 ,R- M 方法 及 开 一 及 
于 保证 收敛 的 条 件 及 理论 根据 ,叙述 起 来 比较 复杂 ,读者 如 有 兴 
趣 ,可 参看 L8. 





1 设 X ,X ,是 独立 同 分 布 的 随机 变量 列 ， 且 
POCO = 1)=b-1--P(OX =-0) (0 一 0 过 1) 

mint2:X, 一 1}， 当 存 在 "之 1 ,使 得 X, 王 1 
ee， 否则 
试 证 明 r* 是 序列 {X,,x1) 的 停止 法 则 并 计算 r 的 数学 期 望 . 

2. 甲 有 资本 M 元 , 乙 有 资本 N 元 (M 和 都 是 正 整 数 ) ,两 人 进行 
博 ,每 一 局 中 若 甲 胜 , 则 乙 给 甲 一 元 ; 若 乙 胜 , 则 甲 给 乙 一 元 . 设 每 局 中 甲 胜 
的 概率 是 2(0<p<1). 问 :如 果 一 局 一 局 地 峙 下 去 , 甲 输 光 的 概率 是 多 少 ? 
平均 几 局 后 有 一 方 输 光 ? 

3. 设 X ,Xs ，… 是 独立 同 分 布 的 随机 变量 列 ,共同 分 布 是 N(u,oz)(#p 已 


An 2: 土 hnN 人 cz -一 让 了 TAIATISIEE 
AN SI 未 上 山 /1/。 泗 十 0GI、 人 人 02 了 疝 刘 十 1 


卫 。 :0 一 Oil， 万 : :0 一 02 


有 1 
属 全 站 
必 工 妇 0 
其 中 co>0 是 未 知 参 数 ， 
给 定 0<oo<ci , 试 对 检验 问题 
io :0 一 ao 全 局 :co 一 0l 


求 出 序 贯 顾 率 比 检验 法 . 


5. 由 于 费用 昂贵 ,在 战略 导弹 的 精度 验收 工作 中 和 和 常 至 多 允许 发 射 两 


发 导弹 就 要 鉴定 一 批 导 弹 能 否 通 过 验收 -你 日 标点 且 挫 标 央 上 , 犀 晒 的 落 直 
全 可 计 员 刀 J 员 可 证 此 和 条 计生 议 ， 玉 有 尿 征 二 人 居 了 全 ?可 才 电 和 外 


坐标 是 (X,Y) ,假定 和 与 了 相互 独立 ,X 一 NO )，Y~NCOa )Cc 未 知 )， 
验收 工作 中 的 检验 问题 是 | 
玉 。:o 一 oo 人 :0 一 Oil 
这 里 me<o yo 是 精度 的 设计 指标 . 试用 类 似 于 序 贯 相 率 比 检验 的 思想 设计 
出 一 个 至 多 发 射 两 发 导弹 的 检验 方案 . 
6. 设 Xi,X:,… 独 立 同 分 布 ,Xi 的 分 布 密度 是 广 (z) 或 户 (z 六 到 帮 是 
哪 一 个 不 知道 ) ,给 定 检 验 问 题 ; 


妃 , ; PCz) 是 真正 的 分 布 密度 e* 万 , : 户 (z) 是 真正 的 分 布 密度 . 

设 (r,d) 是 任 一 序 贯 检验 法 (其 中 r 是 {X,，x1} 的 停止 法 则 ,d 是 关 
决 法 则 ) ,其 第 一 类 错误 的 概率 是 n, 第 二 类 错误 的 概率 是 P 试 证 明 十 6<-1 
时 有 不 等 式 


下 ;7 之 上 一 

I 二 一 克 ); > 
bn-& + 一 Pin= 一 《人 
下 2r 


也 (入 一 1) 一 力 -1_P(CX= 0 ) 
其 中 少 未 知 ,0<b<1，P,(A) 表 示 参 数 是 请 时 事件 A 的 概率 . 给 定 1E (0， 
1)，7YE(0,1) 
本 


信 区 间 ; 
(2) 试用 反 证 法 证 明 ; 对 任何 正 整数 交 及 基于 样本 X, ,X, ,…X, 的 估计 


apilvriio 。 司 Me es 


量 0 一 OCXi , 及? 9 ,X (0 委 o 委 1) , 恒 成 立 : 





“ 瑟 
InL 二 
0<p<1 


忆 
鬼 厂 [证 说 在 转 定 梯 丰 量 桂 和 形 下 本 纹 梯 本 有 量 人 和 才 全 沥 
JJ JJ TAI 人 个 下 IR7Z TI ?3 7 已 “人 理性 马 和 


足够 小 的 估计 量 . 


@ 六 门 


AAA 





第 七 章 “统计 决策 与 贝 叶 斯 统计 大 意 


人 


3 统计 决策 问题 概述 


我 们 已 经 比较 详细 地 讨论 了 估计 和 假设 检验 ， 它们 可 以 看 成 


有 白 .让 般 的 “统计 决策 > 的 特殊 情 2 二 y0AG nn 人 西关 得 由 
和 正二 人/ 疏 8 区 六 有 的 特殊 情形 . 统计 次 沫 由 四 : 】 女 寻 填 全， 


设 X 的 分 布 顺 数 是 FF(Cz,0)， 0 是 未 知人 参数 ,0 和 9,9 叫做 参数 


扣 产 二、 上 上 PP 上 了 一 一 一 人 


空间 ,入 二 (Xi，…X) 是 % 的 梓 本 . 又 设 A 是 茶 项 实际 工作 中 可 
能 采取 的 各 种 行动 所 组 成 的 非 空 集合 ,4 叫做 行动 窄 间 . 工 (9,a) 


可 机 全 六 


是 定义 在 @ xA 上 的 非 负 丽 数 ， 它 表 示 参 数 是 g 时 采取 和 村 动 a 4E 
A 日 ll 杞 的 提 生 TH a) 叫 做 损失 盟 数 (四 ,XALIOa)) 叫 做 和 
< 之 和 -AS 一 有 JJ 9 9 7 】 岗 有 AN 让 有 人。 人 > 一 此 记过 5 
计 决 策 问题 的 四 个 要 素 山 . 


统计 决策 问题 是 :如 何 根据 样本 民 的 值 恰当 地 选取 行动 a 使 
得 引起 的 损失 尽 可 能 的 小 四 

下 面 要 对 这 和 句 话 的 确切 含义 进行 论述 . 

定义 1.1 称 样本 空间 ( 即 样本 所 有 可 能 值 组 成 的 集合 ) 到 行 
动 空间 A 的 映射 $ 王 SCz ,…,z,) 为 决策 函数 ,简称 决策 . 

定义 1.2 设 和 =S(Czl,，…,zo) 是 一 个 决策 , 称 平 均 损 失 

Rb,8) 一 尼 LKDSCX ee XD) 

为 8 的 风险 : 

自然 想到 要 找 风 险 最 小 的 决策 ,但 风险 尺 (0,6) 是 0 的 本 数 ， 


对 一 切 4 风险 最 小 的 决策 (所 谓 一 臻 最 优 决策 ) 难 得 存在 . 


G@。 本 节 是 对 “统计 决策 " 作 粗浅 的 介绍 ,不 对 有 关 概 念 给 出 数学 上 精确 的 陈述 . 
例如 ,不 对 有 关 的 函数 或 映射 所 出 “可 测 性 "的 要 求 


Yi AAA- 下 一 -7 1 - 声 ~ 一 -和 FF TAO 四 AL FE 才 广 
习 全 二 名 一 4 月 也 台 无 了 服 区 国 ) 册 ,了 最 吊 几 的 月 
和 % 本 0 2 ， 、: (二 . 江 ) 
7T (1 oa) 一 |0 一 < 【1 2) 
LU 9(kC4 | c | 人 


(1.1) 叫 做 平方 损失 ,(1. 2) 叫 做 绝对 偏差 损失 . 在 估计 问题 中 的 
决策 就 是 佑 计量 ,在 平方 损失 下 ,一 臻 最 优 决 策 就 是 均 方 误差 最 小 
的 估计 量 . CS 

在 假设 检验 问题 中 ,参数 空间 9= 6, U@, ,@, 与 9, 不 相交 . 
设 五 ,是 E BiG 一 0,1) ,行动 空间 4 一 (ao,a:) ,其 中 ai 表示 接受 
Hi(Gi 一 0,1)， 损失 函数 的 类 型 很 多 ,最 常见 的 有 


0， 
Me ooo 一 1 人 
“9 UV 所 Li 


这 时 L(b,a) 叫 向 0 - 1 损失 


大 叭 振 册 对 于 假设 检验 问题 所 由 十 千 征 价 干 给 出 退 扯 颁 
个 诞 肯 出 有 本 用 父 伺 王 站 和 ?有 由 从 宁可 四 了 有 四 说 


否定 域 。 


《上 


例 1.1 检查 某 设备 零件 : 
零件 的 可 能 状态 :0 (好 ) ,b( 坏 ) 
可 能 来 取 的 行动 :ai (保留 ) ,az( 昔 换 ) ,as (修理 ). 





ne 汪 (7 了 
隐 豆 广 
ee | 
0 
0 0.3 0.7 


0 0.6 0.4 


应 采取 怎样 的 决策 使 得 损失 尽 可 能 小 ? 


败 人 一 一 人 1 一 二 疙 虽 一 [一 


Ce 9 个 ,列表 如 下 : 





风险 为 
R(b,0) 一 EL(OSCXD)) 四 
王 L(g,a)P(CX) 一 a) 十 L(g,as)P(CCX) 一 oz) 十 
L(b,as) PCBCX) 一 as) 


， 





下 (006)| 0 7 2. 
R(b ,0)| 12 7.6 9.6 


Oo 
< 刀 
CD 《站 


一 和 一 站。 站 一 全 下 放下 


个 好 呢 ? 这 了 恕 不 好 回答 了 了. 


工 。 呈 4 小 如 1 A 民 


一 志和 记 使 得 


哪个 决策 好 呢 ? 有 些 是 明显 的 ,如 & 优 于 ,02%. 但 9 与 2 哪 


不 难看 出 ,在 前 面 的 例 1. 1 中 ,0 ,04 6 ， 06 了 是 容许 的 ， 0z> ， 
1 是 不 容许 的 击 且 .。 下 存在 一 臻 最 优 J 决策. 
AS LA 关 i -JJ9 1 Ci 1 “IJL AL LU HL NA 

如 果 一 臻 最 优 决 策 不 存在 ,只 好 去 找 比 较 “ 优 良 ” 的 决策 了 . 
- 丰 TE 从 公营 信介 一 是 对 决策 本 
有 /条 过 人 站 过 1 AAA。 二 AI 大 灾 0 作 定 的 限制 ,缩小 选 


择 的 范围 ,在 较 小 的 范围 内 找 最 优 的 ,例如 在 估计 问题 中 要 求 $ 是 
无 侯 的 估计 ,在 所 有 无 偏 估计 中 找 最 优 的 . 另 一 是 放宽 比较 的 要 


es。 3 了 6 了 3 。 


电码 


求 ,不 要 求 风 险 函 数 对 一 切 0 都 最 小 . 


ae 其 和 一 外 和 一 上 一 人 


定义 1.4 称 次 策 和 是 minimax 决策 , 若 对 一 切 决 策 8 成 
supR(0,0 )<<supR(0,5) 


< 


minimax 决策 是 一 种 保守 的 决策 . 不 难看 出 ,在 例 1.1 中 & 
是 minimax 决策 ， 
当然 ,在 许多 情形 下 应 尽量 避免 采用 保守 的 决策 . 


了 ”从 


为 此 ， 
参数 0 有 所 了 解 ,知道 哪些 0 值 出 现 机 会 较 多 ,哪些 0 值 出 现 机 
本 F / 作 换 休 话说， 应 将 0 看 成 一 个 随机 变量 ， 它 有 确定 的 概 


“Ase 一 可 EL 2 人 一 有 IDU 


布 . 在 这 种 情形 下 ,风险 尺 (0,6) 关 于 0 的 分 布 的 平均 值 A(5) = 一 
了 R(0,9) 是 评价 决策 $ 的 优良 性 指标 ,数值 越 小 越 好 . 把 未 知 参 数 
0 看 成 是 随机 变量 ,这 是 一 种 重要 的 观点 ,对 统计 学 有 重大 影响 ， 
下 面 要 作 进 一 步 介 绍 . 


六 时 


8$2 什么 是 贝 叶 期 统计 


公元 1763 年 , 贝 叶 斯 (IT. Bayes,1702-1761, 英 国 长 老 会 的 
牧师 ) 的 著作 《4 论 有 关机 遇 问 题 的 求解 》 发 表 了 。 这 篇 著作 所 出 了 
一 种 归纳 推理 的 理论 。 这 个 理论 以 后 被 一 些 学 者 发 展 为 一 种 系统 


的 综 计 推 瞩 广 沁 和 丈 灿 骨 上 叶 基 六 尘 有 用 六 种 方法 作 统 计 推 虞 折 
具 J53U 让 多 1 人 人 9 人 /入 入 人 机 不/ 丽 过 人 刀 近 IF 二 和 和 印 []A 


得 的 全 部 绪 采 ,构成 册 叶 斯 统计 的 内 容 . 认为 册 叶 斯 方法 是 唯一 


信阳 上 多 证 夫人 LA bH bp La -HE mm DLAFr aa SEE 
己 注 有 JJ 区 了 | 推断 方 法 的 统计 学 者 ,组 歹 统 讨 了 了 本 有 和 人 人 和子 化， 


作 
个 学 派 始 目 20 人 30 平公 攻 50、60 年 代 引 起 人 们 广泛 的 注 


二 rzyb), 其 中 9 是 未 知 


入 AAA 


人 体 和 
的 ,但 知 0 的 变化 范围 是 9@, 经 典 方法 把 参数 0 看 作 是 客观 并 数 ， 


请 计 对 样本 一 (X  .， 允 )》 的 研究 对 0 维 员 估计 值 或 老 椎 打 0 


,二 人 人 4 全 \<LY19 ”nn] RAINU DID HE 一 人 让 多 II 


属于 某 个 给 定 的 范围 ， 贝 叶 斯 学 派 的 根本 观点 ,是 认为 在 关于 6 
的 任何 统计 推断 问题 中 ,除了 使 用 样本 发 提供 的 信息 外 ,还 必须 


。 364 。 


对 0 规定 一 个 先 验 分 布 , 它 是 进行 推断 时 不 可 缺少 的 要 素 ， 说 得 


| 日 也 全 此 et- 上 1 < _E 7 一 ”耳语 rr 上 -rr 让 一 人 


更 明确 些 , 应 把 0 看 成 随机 变量 (为 了 强调 这 一 点 ,月 时 把 0 写成 


0 ) , 它 服从 某 个 概率 分 布 ( 叫 做 先 验 分 布 ) ,总 体 X 的 和 分布 实际 上 
是 0 给 定时 X 的 条 件 分 布 . 册 叶 斯 学 派 把 先 验 分 布 看 成 是 在 抽样 


一 h 二 站、\ 卫生 二 修一 一 > -wp 月- 了 TA fa 蔬 A Jr FT VAN -< 一 T 会 户 


(或 观测 ?前 就 有 的 关于 0 的 先 验 信 息 的 概率 表述 , 先 验 分 布 可 能 
有 客观 的 依据 ， 也 可 以 部 分 地 或 是 全 部 地 基于 主观 信念 . 根据 入 


的 分 布 密度 (或 概率 函数 ) f(z,b) 及 6 的 先 验 分 布 密度 (或 先 验 概 
率 果 数 )&(O)， ,可 以 算出 在 样本 入 一 (入 1， ,2 二 这 攻关 5 ) 


因 


的 条 件 下 ,6 的 条 件 分 布 密度 (或 条 件 概率 函数 )6(b | 志 ) 因为 这 个 
分 布 是 在 抽样 (或 观测 ) 之 后 得 到 的 上 称 为 后 验 介 布 ， 由 叶 斯 党 


二 ae 人 人 人 0 


派 认为 ， 这 个 分 布 综合 了 样本 X 及 先 验 分 布 密度 (或 概率 函数 ) 


er 四 丰 担任 的 仿 自 提 酝 起 洒 测 的 全部 日 的 就 在 千 空 上 出 上 了 验 
sS\ LA ID IS 上 . J 隔 作 、-CV 人 7 RJ 王 RPR 局 R3 人 元 此 看 帮 丽 


分 布 到 后 验 分 布 的 转换 . 贝 叶 斯 方法 的 关键 在 于 所 作出 的 任何 推 
断 者 只 须根 据 后 验 分 布 Sb 天 )， 而 不 再 涉及 样本 忒 的 分 布 . 但 在 
如 何 使 用 5 天) 上 还 有 较 大 的 灵活 性 ,涉及 到 行动 空间 和 损失 肯 
数 的 类 型 . 

沿用 1 中 的 记号 ,用 A 表示 行动 空间 ,用 工 (0,a) 表 未 损失 
函数 若 参 数 0 的 先 验 分 布 是 , 决 策 是 8 一 5(zi,…,z), 则 平均 
风险 为 n(5) 王 E,R(b,5) ,这 里 Rb,9) 是 风险 , 眉 , 是 关于 6 的 概率 
分 布 取 平 均值. 

定义 2.1 称 3 一 9 (zzo) 是 贝 叶 斯 决策 , 若 

po ) 一 in oO) 


-这 


FA 
H 屋 上 叶 期 凡 v 风 . 


注意 的 是 , 贝 叶 斯 决策 依赖 于 先 验 分 布 ， 先 验 和 分 布 变 了 ,由 
也 恋 ， 


0(0) 一 0.7 义 及 (0 9) 十 0.3 义 下 (0 ,9) 
各 个 决策 的 o(6) 值 如 下 : 





YY ANNY 全 R 13 1D2 4Q& QD2 70D 7 帮 An 情 4 区 人 长 壹 7 1KC 2， 
多/ we “<Ae Le 工作 n% f 忆 er/ ae 下 q) 人 f ee <7 je 
从 上 才 可 看 出 
is vvAr AN arTH7T 
》 及 瑟 \ 祭 一 员 局 考 \ as / 
7 3 二 ] | 
正常 (X 王 1) ,就 保留 (ai ) 
是 贝 叶 斯 决策 . 


玫 
# 


若 先 验 分 布 改 为 5b.) 一 0. 9,6(b) 一 0.1, 则 贝 叶 斯 决策 是 人 
贝 叶 斯 统计 的 基本 任务 就 是 针对 先 验 分 布 5(b) , 找 出 贝 叶 斯 
决策 . | 四 

”怎样 寻找 贝 叶 斯 次 策 呢 ? 例 2. 1 所 处 理 的 是 很 简单 的 情形 ， 
穷 举 所 有 的 决策 ,加 以 比较 后 找 出 贝 叶 斯 决策 一般 情形 下 不 能 


这 样 做 ,而 要 利用 后 验 分 布 : 设 SCb|zi，…，z ) 是 样本 (Xi ，…， 


X， ) 一 (zy rr ) 下 6 的 条 件 分 布 密度 (后 验 分 布 9) 令 
，pCziy…wyzn) 一 inf| 工 (9,a)6Cg| zy yzo)d0 (2. 1) 


“一 人、 一》 ”rrL LA 人 1 全 AAA LIL ?1 HTJHNHJAL JJ 7 | 
各 决策 六 一 0 《El …, Zu) 满足 
外 00 NA 9? AAA | 9 -TI 性 化 、 人 ~ 9 9 人 人 NO 
(对 一 二 元 ) 


则 9” 就 是 册 叶 斯 决策 . 这 个 结论 的 数学 证 明 用 到 较 闪 的 数学 对 
识 从 必 入 让 各 十 二 了 瞪 招 潍 有 (ID DAN AN ez vV 灶 唱 叶 其 冰 禾 
AAANH。 2 1 岂 马 VC。w/ OO 定义 力 信 | 罗 [从 写 ， 


(2.2) 的 意义 


是 : 甩 用 决策 9 引起 的 后 验 平 均 损 失 达 到 最 小 值 . 
AD DAN\ 上 王 J 了 RD Pi HA YY AS AAA 十- 人- LI 上 上 三 
《2.2) 是 寻找 贝 叶 斯 决策 的 基本 出 发 氮 ， 为 此 首先 需要 求 出 
后 验 分 布 


own 


”″” 和 WA 


- 采 Fzspg&b) 





人 
| 开 rzoesceo)dg 
当 9 一 (6 ,0 ,…} 时 ,(2,3) 要 用 下 式 代 替 
下 Jri0)66B) 


ce(O| zi ，…，,Z) 一 (2. 4) 


这 工 Fzi0D)6CO) ) 
这 时 (2.4) 是 0 的 后 验 概率 函数 . 


(2. 3) 的 严格 证 明 涉及 到 零 概率 事件 发 生 下 如 何 计算 条 件 概 
率 的 问题 ,要 用 测度 论 才 能 处 理 O , 当 X 及 0 是 离散 型 随机 变量 时 ， 


@ 虽然 本 讲义 不 给 出 (2. 3) 的 严格 证 明 ,但 我 们 可 给 出 下 列 有 道理 的 说 明 : 
P(b 委 b| 关 一 上 e 秋 和 着 委 关 十 si 一 1 2 


_P(O 委 br 一 e 委 区 < 委 症 十 ei 一 112) 
忆 (7， 天- 全; | 十 sy 一 二 1 2 ，……，7) 





RN 一 eE< 妇 Ai ER 二 了 工 ,2，,. 。 71) 
1 ie 
(到 唱 ， eCOTIL7oevodbdn 二 
1 ee -7 
人 | ep 下 euvodoan- -du 
这 里 (8 ON 一 自 当 fxz,9) 是 z 的 连续 函数 时 , 知 
QU / 7 ,过 9U7 心口 JJ 人 LE 大 ER HRJ 9 AH 


AL 有 
imP(6 入 Ti 一 E 委 二 区 云 < Zi 十 ez 一】 8 17) 
ec- 人 交大 
站 COTI Am)d0 


|， 6(b) Ice ,0)d0 


从 直观 上 看 ,上 式 右边 应 该 就 是 P( 靖 二 | 和 


…,X。 一 z), 由 于 的 任意 性 , 知 
8 的 后 验 分 布 密度 是 


(pb) | FPCzi 0) 
1 
| 8) 下 Fezro) 
1 


， 367 。 


(2. 4) 的 证 明 是 不 难 的 . 实际 上 这 时 60) 一 已 CO 一 入 )， 帮 zi30) 


瑚 (X 一 10 一 和》, 于 是 
(0 二 帮 1 一 叱 1 5 人 


也 


_ 忆 (CO 一 -0 六 ! 一 福 1 ， -入 ， 让 IT) 
-了 (入 1 一 1 入 ， 0 ) ，- 


| 
下 
AN 
局 
S 
Se 
vm 
AAA 
Sb 
Ne 


这 就 证 明了 (2.4). (2.4) 就 
4 访 伺 3 YY HE II 《7 女 w 工 I 
gw 以 X .服从 伯 努 利 分 布 ,人 参数 是 如， 即 
和 
设 户 的 先 验 分 布 是 (0,1) 上 的 均匀 分 布 ， 从 (2. 1) 知 在 样本 
作 1 一 1 ) 入， 二 并， 下 也 的 后 验 乃 布 密 度 是 
| 力 乞 (1 一 力 ) 王 生 Ar0D KAN 
SS 下 LI ?av/ 1 2 \LC。D/ 
| 23 (1 一 力 )” 和 db 
J 0 


Mi 十 1,2 十 1 一 >)= 的 8 分布 
行动 空间 A = (0,1) ,损失 函数 是 (1. 1)( 平 方 损失 ), 则 


nt 
1 
| ( 户 一 人 ”CCzl1， ,0D) ) 有 ( 力 | Zn)d 


。 300 。 


一 inf - | 一 aplr 1d 力 《2 6 ) 
从 (2.6) 式 出 发 可 以 证 明 :6* (Rayzm) 恰 好 是 后 验 分 布 ep | 





zx,) 的 均值 ， 利 用 (2.5) 知 
v 吃 开 9》 2 v11 ] iT。 IANA 
， 
| 
人 ( am ww 一 和 YA .可 直 六 本 市 
LA ”vol 9 9 已 他 了 和 
: 间 有 
本 性 ee 
1 十 2 分/ 
>r 立 些 的 见 叶 斯 估计 . 
过 相生 JJ 人 17 罗 IID7 


例 2.3 设 随机 变量 的 密度 明 数 是 F(Cz),0) ,6EB,9= 8 


0 的 先 验 分 布 窗 度 7 门 惟 三 | 


CC 避 oo 外 休 信 CO 的 先 验 分 布 密度 是 S\U7/。 检验 问题 是 : 
互 , :0Eg 访 万 :0EG 轩 ， M 


设 4A=(aoa (ai 表示 接受 假设 五: 一 0,1). 重生 的 样本 
(Xi X,) 取 值 (z zi),0 的 后 验 分 布 密度 为 人 (CO|zi 
zu), 又 LOa) 是 0-1. 损 失 ( 见 (1.3)2). 则 

| ai Ta 外 


三 
一 1 一 P(b E g9;|X 一 ZX 一 Zo) (一 0，1) 
从 (2. 2) 知 贝 叶 斯 决策 为 
mo 当 PC E Bi | 一 其 ,一 z) 之 


0 (Z ，… 1) 一 。 二 局 汪 
否则 


1 一 7/ HA 号 mA、 


作为 本 贡 的 末尾 ,我 们 还 要 简略 地 介绍 (时 斯 序 贯 统计 决策 


ee AGO 。 
NA 


ago 0 取 值 属于 @ 本 


/NA - 丰 - erKD) 了 伺 -HE 一 求人 LU 二 < \ 症 4 一 
凡人 2 4 是 行动 空间 , 工 (0,a) 是 损失 天 数 . 取 剂 从 进行 迁 系 次 
观测 ,和 X ,X ，…, 单 次 观测 的 费用 是 C 盖 0. 


策 由 停止 法 则 * 及 判决 法 则 8 组 成 停止 法 则 * 


S 汪 
半 : 
消 “ 有 


告诉 我 们 何 时 停止 观测 ,r 是 不 依赖 于 将 来 的 随机 变量 ( 见 第 六 
章 ); 判 决 法 则 8 告诉 我 们 ,如 何 根据 序 贯 样本 Xi,，…，,X, 选取 行 
zh ANY 了 YANIAHOI 估 属于 AN 
2JO\ AI1? ?人 r/ 人 \ 人 OH 有 网 」 人 7/ ，。 


定 9 时 诸 交 WE rz,b) 时 计算 期 望 


”定义 2.2 . 称 (r*,86“  ) 有 是 由 时 斯 序 般 决策 ,和 若 


二 AL 2 OO 7 志和 人 ”1 交 | 门 ”凡人 人. 


Or ) 一 in OUCzyG) 


设 0 的 先 验 分 布 密度 是 上 6(0)， 帮 = ，…，X, 一 下 0 的 后 验 
分 在 和 谨 尖 ArOlr  。。。 > 、 了 
万 人 名 丰 这 /SU II Zn] 。 多 
《rz 一 7 } 一 《人 (Xi … 入 )GE 
可 以 证 明 
| 
OAT 


本 ww mm ww 匡 re -mm 1| wN ， |] 
(rc 一 之 有 [ECe,sCe 十 nrCJ]sCO|lzl，…，Zn)d0 
J 。 人 za Zr) dz dz， (2.7) 

这 里 六 (zl，… Zn) 是 入 1，…， 入 ， 的 联合 多 度 ， 


辣 ， 吕 和 9 太 


7 
六 7 | 二 rr nmnNaerAN 是 nm 
JJ] 之 1 9 ”3 之 mn 一 | ] ] /ps UV QU 
秒 “: 
本 


大 入 是 这 样 的 :对 一 切 aecA 及 my>1 有 
| 工人 oa)8Cglz zz)d8 


> | 087 Greyza)D6001 zi yo) 
人 (一 场 z yz) 、， (02.8) 


从 (2.7) 不 难看 出 


SN 其 只 


(r; 0) 之 DCryG”) 
CO 9 OO -一 0 9 


为 了 使 总 风险 达到 最 小 ,只 须 找 停止 法 则 r* 使 得 


Or ,6 人 intoktr'9 1 


JI 仁 
JUN 旋 


这 融化 成 了 孙 包 的 县 优 信 小 
也 和 锁 已 觅 有 和 石 凤 了 取 人 已 行 于 


沦 ,读者 可 参阅 [8] 
Le 有 2 一 (mm 门 AAA 一 WEr Ho As 1 
be 以 LUU1 人 CCLC2 3 人 有 JI 且 下 | 


的 概率 画 数 FCz,0) 是 这 样 的 


\A | 
Cr， 人 2 
SS 


司 题 
se 


村 


五 


1 一 a 0 ae 
0 0 1 一 a Q (0<a<<<1) 
设 0 的 先 验 分 布 为 
P(0 一 2 1 一 P(0 一 人 (< 
册 0 D 
站 太 7F、、AnNY 


又 设 单 次 观测 的 费用 是 C 之 0. 我 们 指出 ,存在 序 贯 统计 决策 比 固 


三 
AL 1 人 全 引 HJI 女 对。 


首先 求 出 后 验 分 布 . 不 难看 出 ， 
P(XI 一 zi 一 工 ) 
=-eT[7czob0)+G -9TIAzoo 


可 见 , 行 Zi，……Zv 中 既 含有 1, 又 含有 2， 则 上 述 概率 为 0. 以 下 不 
妨 设 为 过 1 9 ”9 必 n 中 不 同时 含有 1] 和 2. 经 计算 天 


80 | 二 P(O 一 b | 和 一 次 一 并 ) 
] ， 当 Zi 中 含有 1 
3 机 中 含有 2 
归 当 z,; 一 = 一 3 
(0， | 之 一 1 一 上 0 | Zi ) 
易 知 , 最 小 后 验 平均 损失 


OUCZ1 ? > min > LCg Q)ECO zi， 9“。 Th) 


zt 一 这 1 


一 0OmInCE(CO 二 9。。。 二 冯 ,ECO， | | 5 
pc ， 当 
00， 理 骨 


少 


ai， 当 z……z, 中 含有 1] 
az， 否则 

易 知 ,27 (zzo) 的 后 验 平均 损失 正好 是 e(z，… ze) 由 此 可 
见 , 对 任何 固定 的 样本 量 ”% 贝 叶 斯 决策 是 8* . 此 时 的 总 风险 ( 损 


0 (mao 一 | (2. 9 ) 


失 与 观测 费用 之 和 的 平均 值 ) 为 
(2) 一 下 OAl XXX) 十 7MC 
二 OPC EARL 
一 506o" 十 7C 
目 然 问 :2” 取 何 值 时 ,o(Cz2) 最 小 ? 
公 
&AD 1 
Ce 世 (2. 10) 
易 知 总 民 十 Cz 在 





时 达 最 小 值 : 


策 3AI 4 
af 忆 


_ eollinwu 
oO 7 一 (1 二 1 C ) 
| ， .| 1 袜 | ! 人 
(这 里 假定 ”” 是 整数 ). 
站 LA 二 HH FF HP 必 2 FrLHcyh PH 目 
以 上 上 二 包 人 克 -9 /放生 仆人 量具 入 为 | 人 大 丰 和 内 作 中 于/ 
7 ”最 好 . 
人 


; 人 N 一 Inft2 :202 之 1 入 天 3) 
这 六 是 一 个 俘 止 法 则 .. 用 4 表示 这 样 的 判决 法 则 ,对 一 切 zi ，…， 


-之 人 (Zi ”9 局 ) 一 和 (Ziy， TD)(O， 的 定义 久 见 (2.9).). 
我 们 指出 , 序 贯 统计 决策 (N,0*) 的 总 风险 小 于 o(n7)， 
实际 上 ,， 比 时 


NE) 
GAS) 
其 中 
BGS 5 
各 
玫 二 上 个 ?一 1 个 
从 (2.7) 知 


一 CC 一 7) 


戎 一】 
天 一 


-CnP( 一 3，… 0 


刀 zF 





OK 汪汪 SEE 


让 a| 


如 何 确定 先 验 分 布 , 这 是 贝 叶 斯 统计 中 最 困难 ,也 是 使 用 岁 叶 
斯 方法 必须 解决 但 又 最 易 引 起 争议 的 问题 .这 个 问题 现代 有 很 多 


wa 用 ae 


全 究 成 采 ,但 还 没有 圆满 的 理论 与 普遍 有 效 的 方法 (参看 S. 开 otz 


纪 呈 言 之 公法 的 4《4 琶 代 册 有 叶 匠 和 计 上 党》 中国 综 计 出 上 晓 计 .2000 万 
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J. O. Berger 车 的 4 统计 决策 论 及 贝 叶 斯 分 析 兴 机 旋 光 译 ), 中 国 统 
计 出 版 社 ,1998)， 从 实用 角度 出 发 ,应 充分 利用 专 冢 的 经 验 或 者 
对 历史 上 积累 的 数据 进行 分 析 和 拟 合 , 以 确定 先 验 分 布 . 在 确定 
先 验 分 布 时 ,许多 人 利用 下 列 的 协调 性 假说 . 

协调 性 假说 :者 总 体 X 的 分 布 密度 (或 概率 函数 ) 是 FCz,0)， 
则 2 的 先 验 分 布 与 由 它 和 民 的 样本 确定 的 后 验 分 布 应 属于 同一 
类 型 . 这 时 先 验 分 布 叫做 是 与 Az,0) 共 斩 的 分 布 . 

这 里 未 对 ”同一 类 型 “四 字 给 出 精确 的 定义 ,也 很 难 给 出 恰当 
的 定义 . 通常 的 理解 是 ,将 概率 性 质 相 似 的 所 有 分 布 算 作 同一 类 
型 . 例如 ,所 有 正 态 分 布 构成 一 类 ;所 且 分 布 构成 一 类 ;所 有 8 
分 布 构成 一 类 . 

这 个 假说 指示 我 们 , 先 验 分 布 应 取 何 种 类 型 ,然后 再 利用 历史 


一 本 AU 下 一 ww 一 Ya 人 1 


数据 来 确定 先 验 分 布 中 的 未 知 部 分 . 许多 实践 表明 ,这 个 假说 是 
人 


符合 实际 的 . 

以 下 我 们 要 对 一 些 稼 见 的 分 布 找 出 其 共 斩 的 先 验 分 布 

定理 3.1 设 X，…,X。 是 来 目 伯 努 利 分 布 ( 参 数 是 如 ,0< 
<1) 的 样本 . 在 了 馆 的 先 验 分 布 是 8 分 布 , 参 数 是 ,6, 则 在 Xi: 一 
栓 W 一 下 的 户 险 余 在 县 会 娄 册 二 py 一 AQ 4 
<I19? ?4n va ZL HB 让 刀 人 和 十 缘 多 人 C wy wy RnP 记 


证 明 :X ,…，,X, 的 联合 概率 函数 为 


站 、 


7 


列 


为 生 (1 一 用 ”全 


J (zi 53 力 ) 一 








- 


人 


] 


元 
取 


力 的 先 验 分 布 密度 
上 ( 四 ) 一 C(ay 8) 加 (1 一 加 ) 
(这 里 C(c .9) 是 常数 )， 从 公式 (2.3) 知 的 后 验 分 布 密度 为 


本 一 “人 


刀 (ZZn3 访 )6CD) 


1 

| 0 5 

0 -93P] SA PLAN 
0 


2 。 六 一 
< 人 9 9 AP 了 


一 Ap 中 秆 51 (1 1 一 方 ) 针 生生 5 


1 


这 里 A 是 与 如 无关 的 数 , 可 见 后 验 分 布 是 参数 为 we 十 yp8 十 7 一 》 

的 8 分 布 . 证 毕 . 
定理 3. 1 告诉 我 们 ， 8 分布 族 是 伯 努 利 分 布 族 的 共 氏 分 布 族 
定理 3.2 设 Xi,,…,X, 是 来 自 Poissor 分 布 的 样本 .Pois- 

son 分 布 的 参数 是 1,) 的 先 验 分 布 是 卫 分 布 ( 参 数 是 ,8), 则 在 


六 下》 的 后 验 分 布 是 参数 为 十 > ,2 ,0 十 7 的 开 
分 布 . 


?下 日 人 站 日 这 LA 相隔 光 和 汪 
XUL ZJ LA1LI 9? 9? 人 7 2 有 TEA] 
0 
E 一 纹 
万 (Zi 9 ””” 9 必 m 5 7 一 了 本 < 


1 的 移 验 分 布 密度 是 
se) 一 Chele-a (之 0) 


根据 (2. 3) 知 4 的 后 验 分 布 密度 为 

<(CA |Z 一 AAA “en (> 二 0) 
其 中 A 是 与 无关 的 常数 这 表明 后 验 分 布 是 参数 为 c 十 zi， 
8 十 对 的 卫 分 布 . 证 毕 . 


。 375 。 


理 3.3 设 Xi，…，X, 是 来 目 指数 分 布 丰 (z)1 一 e 和 (A 


三 门 由 AAA -上 ”TI 


N\ 由 Ci 二 一 上 一 FL 3 和 
) 的 储 本 区 参 效 的 抑 验 分 布 是 参数 为 c6 的 卫 分布 , 则 
入 下 、， 


的 后 验 分 布 是 参数 为 c 十 mn8 十 > zi 的 


] 


证 有 明 : 从 1 本 六 ， 的 联合 密度 为 
5 (5 9 ”” ”9 之 1 一 Me 了 
e() 一 Che le-A (>0) 
从 公式 (2.3) 知 和 的 后 验 分 布 密度 
-(KpHynz DA 
ECA|zi TD 一 Ar ee 


< 


ff nm FTALANA -日 会 沾 ai AAA TAN- 大- YE 
站 局 吕 信人 下 下 经 天 人 ax 十 70 下 之 px Li 上 JJL 太 4 仙 。 ML -全 。 
定理 3 丰 设 1 9 入， 是 来 自 No ) 的 样本 ,其 中 CT 世 


知 ,mw 未 知 ， 设 H[ 的 先 验 分 布 为 八 (po ,00 ) , 则 在 过 
区 下 ，Aw 的 后 验 分 布 为 NAp (co- )) ,其 中 


2 2 一 2 
人 poa 十 75oCZ) (| (3. 1) 
站 0 十 7 站 夺 
20 
(rr )2 一 -一 C3 2 ) 
IT 十 7MIo0 
证 明 :和 1:， 入， 的 联合 密度 为 


这 里 C 与 / 无 关 . 又 的 先 验 分 布 密度 为 
0O 一 Cexp| 一 全 5 全 一 
从 公式 (2. 3) 知 后 验 分 布 密度 为 
人 和 0 一 Aexp 人 | 一 下 ( 一 下 一 次 人 一 mo 


ee 376 。 


其 中 4 与 Ap 无 关 . 但 是 
基 (p 一 二 ?十 二 (一 AD 
77 ] 2 人 


一 (县 十 语 j 一 2( 下 束 十 猴 ) 十 瑟 ( 殊 ): 十 欠 


CC G0 





本 


G 
其 中 心 由 (3.1) 确 定 ， 汪 无 和 大 . 于 是 
<S(Cux Ziy， 本 人 )2 1 
P] 风 后 验 分 布 是 No (ax 7) FF 引 
4 LU 7 二 .LT 人 全 “到 NULA AAA。 ML 一 | 。 
从 定理 3.4 看 出 ,六 是 工 与 pe 的 加 权 平 均 . 这 与 直观 相符 ， 
2 >》 一 一 由 万 二 半 二 人 捷 王 
00 脱 和 八 ?Ao 有 上 用人 小 所 冬 
定理 3. 5$ 设 和 XI，…， ， 是 来 目 六 (元 ) 的 样本 尽 已 知 , 玉 


未 知 , 设 下 的 先 验 分 布 是 参数 为 ,8 的 工 分 布 . 则 在 入 : 一 19 9》 
X, 一 rz， 下 , 玉 的 后 验 分 布 是 参数 为 x ;8 的 下 分 布 , 这 里 a 一 a 十 


2 一 A). 
证 明 : 入 1 从， 的 联合 密度 为 、 


ff YY @ @ @ 到) 一 (人 PP 王 


mAN 史 ly》 之 站 LS] 一 人 vv] LS 局 


C: 是 与 及 无 关 的 常数 玉 的 先 验 分 布 密度 为 
ER) 一 CiRe le A 
从 公式 (2.3) 知 下 的 后 验 分 布 密度 为 


CRetE-l 。e (内 二 辣 (a -OO DR 


见 后 验 分 布 是 参数 为 w 0 及 分布 . 证 毕 . 
为 了 研究 均匀 分 布 的 共 罗 分 布 ,引进 定义 3. 1 
定义 3.1 称 X 服从 参数 : ZuoD0,a>>0 的 Pareto 分 布 , 香 


它 的 分 布 密度 是 


， 天 
0 (一 的” 


吧 


0 ， 元 过 过 
O( 工 ; ; Zo ya) 一 有 


全 
定理 3.6 设 Xi,…,X, 是 来 自 L0,0j 上 均匀 分 布 的 样本 . 三 
0 的 先 验 分 布 是 参数 为 go,a 的 Pareto 分 布 ， 则 和 在 XI 一 Zi，…， 
X, 一 z, 下 0 的 后 验 分 布 是 参数 为 6o,a 十 ?的 Pareto 分 布 , 这 由 


0 一 max{O ,Zi ， 工 )， 


证 有 明 :入 1 9 , 的 联合 :4 


E 
油 
半 


而 0 的 先 难 分 布 密度 


a 仿 
FTHT Jrw ,co) 《0O) 


根据 (2.3) 知 6 的 后 验 分 布 密度 是 

(0|z oz) 一 Ab "Tioan(maxzi)。a0 Te (0) 

一 Crrv (CO)。 的 1 

这 里 C 是 与 0 无 关 的 数 ,00 王 max(b zi,z)， 可见, 后 验 分 布 
是 参数 为 0 ,a 十 7 的 Pareto 分 布 . 证 毕 . 

以 上 都 是 讨论 单个 实 参 数 的 先 验 分 布 ,以 下 讨论 两 个 实 参 数 
的 二 维 先 验 分 布 . 

定义 3.2 称 随 机 向 量 CM, 尺 ) 服 从 参数 为 (pw,ryayp) 的 正 态 
有 卫 分布 , 寿 玉 的 边缘 分 布 是 参数 为 c,8 的 卫 分布 ,而 在 下 =” 下 M 


的 条 件 分 布 是 N (w, 二 ).， 这 时 (M,R) 的 分 布 密度 为 


DCO; 0 ,Q ) 一 


本 


] ， 王 和 
PT737pT 0 信 二 FAYV ] 


定理 3.7 设 Xi ,，…,X, 是 来 自 N (M, 去 ) 的 样本 ,M,R 太 


。 3 了 378 。 


知 , 设 (M, 民 ) 的 先 验 分 布 是 参数 为 (ray,p) 的 正 态 - 丰 分 布 , 则 
在 XI 一 ZX 一 Zr 下 ,COM,R) 的 后 验 分 布 是 参数 为 (pr”， 


Q 5 8 ) 的 正 态 - 和 分 布 ,这 里 


> HH <  。 YW 册 HSY 人 和 FF 六 
证 旋 : : 人 1 ? 9 人 An 有 JP 人 证/ 受 / 


| 
帮 ” 


万 (zl Zn371297) 
(M,R) 的 先 验 密 度 为 
上 a 一 也 二 
Frypvr 7 exp| Dr 7 《772 AM) 
从 公式 (2.3) 知 C(M, 尺 ) 的 后 验 分 布 密度 为 


e(m 7 0 


了 本 | r~ 「 < N\21 7 | 
一 (exp 一 本 | 204z ”EC72 一 A | 一 应 ) 
由 于 
(元 一 72)2 十 r(72 一 太 )2 
一 (~ 十 7 /一 2 工 十 证 工 (元 一 A) 
2 rc 十 7 / z 十 7 
于 和 是 


E(7a 7| 工 1 1 





一 DC7y73AN  T aa 0 ) 


即 后 验 分 布 是 参数 为 村 了 分 布 . 证 毕 . 


对 于 两 参数 的 均匀 分 布 , 可 以 证 明 它 的 共 斩 分 布 是 所 谓 二 旨 


Pareto 分 布 . 8 
定义 3.3 称 (i,Yy:) 服 从 参数 是 ”mr va 的 二 维 Pareto 分 
布 (m <” 且 au>0 车 它 的 / 布 密度 是 


六 人 


aa 十 1)(rs 一 六 


\ 
人 
| 


(一 5 上 co 1 =) (yz 1) 
(3. 3) 
定理 3.8 设 X，…,X, 是 来 目 L0 ,94 上 均匀 分 布 的 样本 ， 


0 <0 未 知 ， 设 (0 .) 的 先 验 分 布 是 参数 为 ”1 72 ya 的 二 维 Pareto 
分 布 , 则 在 X 三 ZX 一 Ze 下 , (0 0) 的 后 验 分 布 是 参数 为 
”7 7 oa 的 二 维 Pareto 人 分布, 这 里 六 0 )……。， 工 ，) ，7-? = 

max(7rz yz Zn)sa "一 w 十 7， 


证 了 明 :从 1 9》 区 的 联合 密度 为 
二 TT[ 





广 CZzTo3iO0 0 = 国 6 ,6，] (zi) 
1 Lp 
了 
】 
1 -mln Zi)。【 -oo1Cmnax Zi;) 
(2 一 9) 2 
(0 ,0 ) 的 先 验 密 度 是 (3. 二 根据 公式 (2. 3) 知 (0 02 ) 的 后 验 分 布 
外 六 有 未 本 
SNVUI9VU2 | 过 1? 9 已 P 7 


aa 十 1)(Cr 一 六 ) 
(0 一 9 
六 1 (mnax 远志 
] 
= 汶 ee ] 《0 ,oo ) 《02 ) 


( 门 ”-- 一 
UV2 WILL/ 


人 
comIn Z;) 


一 grCO 02 3 71 ， 72 和 
让 一 上 和 人 一 一 |- 渤 JE 
这 里 1 172 9Q 分 别 见 本 和 定理 y 机 了 人， 六 名 丰 人 直人 盆 从 州 
六 ,7 ao 的 二 维 Pareto 分 布 ， 证 毕 . 


对 于 多 维 分 布 的 共 罗 分 布 ,我 们 不 做 介绍 , 读者 可 参看 [11， 


es。 360 @ 


对 于 一 般 的 分 布 密度 (或 概率 函数 ) F(Cz,0) ,如何 找 其 共 斩 分 布 
族 呢 ? 我 们 指出 ,只 要 样本 Xi ，…X,。 有 固定 维 数 的 充分 统计 量 
(Ai 9 … 人) 一 《0Dl (入 1 9 ””“ 7 入，) 9 ””” OAK 入 1 9 ” 及 7) 
(RE 与 郊 无 大 )， 则 有 一 般 方 法 找 出 共 斩 分 布 族 ， 
户 驻 vv， 的 联 人 全 家庭 有 有 下列 姐 使 二 


芝 入 1， 7<aHt 有 VAN 站 UU 1 3 7 LA 
了 (Zi ，，。 人 0) 
LN 记 1 9 9 人 LT JANE AN 9 9 人 人 9 Ne 开 / 


假定 


「 和 
O < | (ti0)d0 < co 一 
今 
D 王 (72) : 仔 在 2 之 1 工 及 阅 Zn 使 得 
1 一 (PICZ1 9 …) 并,)，。 OA 工 1 yy 工 ) ) 1 
V (0O) 
g(Oit71) 一 一 一 “一 
| ec)d6 

我 们 可 以 证 明 G=(g(bit,z2) :Ci 2) 和) 是 F(z,0) 的 共 辆 分 


设 gc(btm)EG, 它 是 9 的 先 验 分 布 密度 ,在 XI 一 阅 ，…， 
X, 一 Ze 下 0 的 后 验 分 布 密度 是 
CT 00ES0O 


上 (CO| zi 和 …，Zn) 一 一 ww 


| 六 (az 008(C03t72)d0 
设 XXXYi YY 独立 同 分 布 , 则 
六 
一 廊 ( 人 ze2300。 廊 (730) 
取 yi ,，…，yn 使 得 上 =T(y，…y)， 对 给 定 的 Zi，…Zz 令 12 
了 ( 工 9 ”9 已 六 ”.V1 9 ， yn) ,我 们 来 证 明 : 


@ 更 一 般 地 ,可 用 任何 别 的 测度 N(Cdb) 代替 这 里 的 Eebesgue 测度 dg; 当 甸 是 至 
多 可 数 集 时 ,这 里 及 下 面 的 积分 均 应 改 为 求 和 ， 


@ 
4A> 
WO 
jw- 
@ 


ee Fe 人 (02 十 7 ) 


六 芭 从 记 这 
实际 上 ,从 ( 。UD/AH 
CO 3 ” 
CO Oo) 
| 站 (人 Di 4 门 雪 T7 ( + APY 、 国 @@ 四 N 了 0 
] 不 ] 9? 9 《人 LA 193U7 ANY 9 MY 772 LA 


| 9 ”9 过 mn 0) (yl 9 ”””.ym 0) d0 


了 (Zi 9 ” ”9》 定 ma9VI ”9 ynm 50) 


aa 工 7 ww 7 天 


| 关 ”nyVI9 ”ynm 0) d0 


Eee V -mL O) 二 
ee 
| VanCus6)d8 


作为 本 节 的 末尾 ,我们 介绍 广义 先 验 分 布 的 概念 :9 上 任何 非 
负 函 数 g (9) 称 为 0 的 广义 先 验 分 布 密度 (又 叫 权 函 数 )， 值得 注意 
的 是 ,虽然 g(b) 可 能 不 是 概率 密度 函数 ,但 是 公式 

d 六 (> se。 六 ， 
&(0Oz 7 ) 一 < 9 9 -7 9 


天 (Z1，… Tu3O)gC0)dO 
( 当 分 母 有 限时 ) 仍 然 确定 一 分 布 密度 , 它 仍 叫做 0 的 后 验 分 布 密度 . 


一 站 


在 实际 使 用 由 时 斯 方法 时 ,总 要 充分 利用 以 往 积累 的 知识 , 划 
确定 先 验 分 布 . 若 以 往 一 点 知识 也 没有 ,怎么 办 ? 此 时 应 如 何 确 
定 先 验 分 布 ? 

这 个 重要 问题 迄今 尚未 解决 ,此 时 没有 统一 的 、 公 认 的 方 ; 


人 -1 丰 信 人马 | 吕 J 蕊 双 


定 移 验 分 布 . 有 些 人 愿意 及 用 下 列 假设 : 


LT 入 0 在 (一 oo co FE 了 人 估 日 天 上 此花 让 3 虽 几 IF 征 1 会 /人 
LA 人 人 141LN 7 9 -7 -LE LI AH 9 人 JI/ LA 


布 ( 权 郴 数 ) 应 取 g(0)CCC 盖 0)， 


AnDAN -二 门 -和 人 HPD [过 7 门 ) 是 Am 
LV7 右 0 在 他 二 上 胆 ， 0 一 PP UV 7 (一 


无 先 验 知识 时 p 也 无 匈 验 知识 . 


(3) 0 在 (ca,0) 上 取 值 (一 cc 委 a<b 委 ce) , 权 函 数 是 g(0) ,p 二 
“382 。 


(a 光 ) 上 有 定义 的 函数 ,p (z) 盖 0( 一 切 z) 或 者 wp (Zz)<0( 一 切 
z), 则 6=p(O) 的 权 函 数 为 
] 


Ar 一 ] 


1 ) 》 | 《3. 65) 
1P 《7 (的 “| 


( 轨 一 gCor(CO) - 
这 里 o-: 是 p 的 反 函 数 . 
.根据 这 三 条 假设 可 以 推出 :四 (0,ceo) 上 对 应 无 先 验 知 识 的 权 
Re 人 
函数 应 取 末 ;@(0,1) 上 对 应 无 先 验 知识 的 权 函 数 应 es 


应 该 指出 ， 上 面 提 到 的 假设 中 的 第 一 条 和 第 三 条 只 是 一 种 来 
自 直 觉 的 设想 ,并 无 足够 的 科学 依据 ， 从 这 些 假设 所 导出 的 结论 是 
否 合乎 实际 还 需要 通过 实践 来 检验 。 





3$4 应 用 实例 一 一 电视 机 寿命 验证 试验 的 贝 叶 斯 方法 


电视 机 的 使 用 寿命 是 很 重要 的 质量 指标 ,所 谓 使 用 寿命 是 指 


从 开始 使 用 到 规定 的 功能 丧失 为 止 所 经 历 的 时 间 , 当然 希望 寿命 
越 长 越 好 .怎样 验证 一 批 电视 机 的 寿命 是 否 达到 合格 标准 呢 ? 当 


8 em LA 人 E 


然 只 能 采取 抽样 检查 的 方法 . 这 实质 上 是 个 假设 检验 问题 ,数学 


FF 党 描述 如 下 .4 彬 担 国 内 外 的 大 量 煞 据 .可 以 认为 由 初 相 的 寿命 


一 一 1 JR 人 人 站 Ts VD TY HR AAA 有 LU JAD LULLHDN 人 


% 服从 指数 分 布 , 其 密度 晒 数 如 下 


r 人 
/9 


次 
[6 


< 一 人 
工 人、U 


工 


9 克 盖 


其 中 0OE (0,co) 是 未 知 参 数 . 因为 下 X 王 0,0 叫做 平均 无 故障 工作 
时 间 ( 记 作 MTBF) , 即 平均 寿命 . 通常 取 定 两 个 值 0 ,0 ,0; 一 6 ， 


人 


这 个 0 叫 检 验 的 下 限 值 ( 在 验收 问题 中 ,平均 寿命 低 于 0 时 不 应 
接受 ,0 又 叫做 极限 寿命 水 平 )50 叫做 检验 的 上 限 值 ( 平 均 寿 命 


2 


@ 当 g(b) 是 6 的 普通 概率 密度 时 ,从 初等 概率 论 知 : :=pC0) 的 概率 密度 正好 由 
(3.6) 给 出 . 故 g(0) 是 权 函 数 时 ,人 们 想像 内 的 权 函 数 也 应 由 (3. 6) 给 出 ， 


和 
GD 
OO 
wo 

铺 


高 于 b% 时 应 该 接受 ,0 又 叫 合格 寿命 水 平 ) ,比值 = 名/0 叫做 鉴 
别 比 . 传统 的 试验 方案 是 这 样 的 :从 一 大 批 电视 机 中 随机 抽取 > 
台 ,同时 进行 寿命 试验 ,试验 如 小 时 . 在 这 对 X 加 个 台 时 的 试验 
中 ,电视 机 的 失效 数 为 >， 当 r 委 C 时 判定 整 批 合格 ,使 用 方 接收 ; 
当 之 C 时 判定 整 批 不 合格 ,使 用 方 拒 收 ,这 个 C 叫做 合格 判定 


数 ,是 一 个 非 负 整数 . 通常 称 了 一 2Xz 为 总 台 时 数 . 这 个 验证 试 

HA 一直 一 -和 妆 洲 fr 由 引 攻 人 全 THERE 3 At > 局 十 比 

/JJ 木 辐 一 人 参数 72，z0 人 组 成 . 参数 的 选择 依 末 于 天 和 失 和 人 旋 市 

来 的 风险 的 允许 值 . 用 工 (0) = PCr 委 C) 表 示 平 均 寿 命 是 0 时 接 

收 整 批 的 概率 ， L(b) 叫 做 抽样 特性 函数 . ax 一 sup Po(r>C) 叫 做 生 
8 过 所 


产 方 风险 , 即 产品 寿命 合格 却 被 拒 收 的 概率 ;8=sup Po(r 魏 C) 叫 
O<0 
做 使 用 方 风险 , 即 产品 不 合格 却 被 接收 的 概率 . 可 以 证 明 。 


-An 于 


Po (7r>C) 68 王 Po Ce: 有 下 列 公式 : 


1L/ 工 :7 
一 1 一 已 机 坟 ) 


p=- 十 ( 工 ) 
一 i1\O， 
(理由 匈 (4. 27)， 利用 这 两 个 公式 就 可 对 给 定 的 本 工 和 CC 
在 以 往 通行 的 彩色 电视 机 试验 中 , 取 4 一 15 000(h),b 一 


CNnNn7rAN 一 1 人 败 八 上 TAI AN7v1N\ -三 
十 DJ UVUUUADN LA/ 天 一 上 vv JNaw HHJ TB 1 一 000(Pn ) 9 1 


台 时 试验 失效 数 rs 全 全 电 帮 和 a 一 0. 20,8 王 0. 10. 可 
类 


这 100 000 台 时 的 试验 实行 起 来 和 


很 不 容易 ,费时 费 电 , 随 着 彩 

电 司 旺 的 担 训 人 贡 本 了 难 计 MT 下 PR 下 RMR OO 20 OO0 站 班 闽 生 
to 人 JE 有 AI 9” 位 忆 LUL AL 工 芋 上 上 f FPC YI AAA vv AA 人 LLJ 
134.000 台 时 的 试验 (鉴别 比 仍 为 3, 下 同 ). 乔 要 验证 0 为 30000h， 
FT LEETHE mn1T 入 和 八 八 时 二 一 CH 一 人 下 开 人 人 AE 革 TS 并 一 一 一 
从 HE 女 CUL UVUU 人 台 时 的 试验 . 上 听 台 彩 电 同 时 进行 试验 需要 数 百 立 


方 米 的 高 温 房 , 仅 一 次 试验 就 耗 电 26 000 度 . 可 见 , 这 种 既 费 时 义 


is 


费 钱 的 试验 方法 ,显然 不 适应 彩电 生产 发 展 的 形势 


。384 。 


则 


由 上 述 可 见 , 对 于 高 可 乔 性 产品 ,用 古典 统计 方法 建立 的 抽样 


人 人 1 7 一 SI 让 姜 玫 一 下 十 一 一 上 -了 


验收 试验 是 不 能 令 人 满意 的 . 我 们 必须 利用 已 往 积 累 起 来 的 关于 


平均 寿命 0 的 信息 . 换 句 话说 ,应 该 另 辟 捷 径 ., 从 贝 叶 斯 方法 找 出 
路 .我 国 部 分 统计 工作 者 于 20 世纪 80 年 代 中 期 采用 贝 叶 斯 方法 
对 国产 彩电 制定 出 新 的 验证 方案 ,形成 了 “国家 标准 ”下 面 从 数学 


《ZU LN AL 1 所 二 - AT 7 LO 已 HH LA 人 可 


了 人 于 -二 2 > 一 土 世 了 和 才 庆 \ 一 全 门 - 工 王 
我 们 考 谍 有 符 换 的 试验 设 开 始 时 
一 旦 出 现 失效 ， 就 换 一 台新 的 继续 试验 ,试验 进行 


工时 停止 . 设 ~ 是 停止 时 的 累计 失效 数 , 则 有 下 列 基 本 定理 中 ， 


= TB 4 1 


AL we 有 


这 里 Po 表示 平均 寿命 是 0 时 相应 的 概率 . 
证 明 :我 们 首先 指出 ,在 6, 皇 ，…& 相互 独立 ,都 服从 均值 是 


门 -二 上 


记 万 十 忆 求生 AAA - 大 -< 有 二 十 tm ~、 -二 
0 的 指数 分 布 , 则 对 一 切 上 之 0, 有 


中， 大 试 验 是 无 替换 的 , 则 可 以 证 明 下 列 公式 : 


人 (4. 1) 
Pi(r 一 1) 一 1 一 二 (村 ) ce 《4. 2) 


实际 上 , 设 个 产品 的 寿命 分 别 为 古 ，…Xn，, 从 小 到 大 排列 为 Xoa 委 … 委 om. 若 半 个 
产品 同时 投入 试验 , 则 在 时 刻 Xp ,累计 的 试验 时 间 为 Si = >, Xuo 十 (nm 一 DXo。 于 是 对 
4 二 1 


下 一 SN) 令 妈 一 里 一生， (时 


AR 十 117。 二 < (是 ) 忆 玉 一 1) 


全” 
人 
h 一 


有 P;(r 六 一 R) 一 了 (Ce 去 

d 

一 (人 一 & 十 1)z 服从 均值 是 0 的 指数 分 布 
kt 十 1 

>》，V 委 一 > 


利用 下 面 的 (4. 5) 即 知 (4. 1) 成 立 ,(4. 2) 从 (4. 1) 直 接 得到. 


明 zx 1 ?MK2 9， ”9 zir 相互 独立 





P( ye < 引 =| 二 ec 二。 一 全 dz (4. 4) 
] CV 入 f. 了 7 


可 用 归纳 法 证 明 . 当 &=1 时 ,显然 成 立 . 设 & 三 ! 时 (4. 4) 成 立 , 则 


[十 1 


275 的 密度 函数 





| 上 
pz) 一 | 方 CTDT ”7 


一 一 一 一 一 者 ”一 一 一 
DT Te 
LU7 


可 见 (4. 4) 对 有 & 王 /十 1 也 成 立 . 所 以 对 一 切 & 之 1,(04.4) 总 成 立 . 
) 


字 |H 


[上 4 Ht 厂 口 
从 \ 生 . 二 /七 


记 


下 让 

RTVOI) 全 2 \ 生 .DY 

设 有 7 个 产品 同时 投入 试验 , 行 (6 2 
是 一 族 相互 独立 同 分 布 的 随机 变量 ,共同 分 布 是 均值 为 0 的 指数 
分 布 . 因为 试验 为 有 蔡 换 的 ,总 试验 时 间 为 工 , 故 试验 持续 时 间 为 


了 
io 一 一 .显然 
1 
f 六 十 1 
夺 N rTp | < 一 } | 
三 7 六 二 六 / 二 os 人 195 
r] 十 … 十 r 一 上 ii 一 1 7 一 1 三 革 





本 
外 和 0 9/ 
-让 (守信 ) 广 而 (5) 


这 就 证 明了 (4. 3). 证 毕 . 
。386 ， 


从 (4. 3) 看 出 ,失效 数 > 服从 Poisson 分 布 ， 从 (4.1) 和 (4. 2) 


谨 D 可 十 圭 二 4 让 Ap 六 六 光 本 AI TI AAA -大 ~ 


知 , 对 无 答 找 的 试验 :大 殖 效 达 似 版 从 上 olsson 刀 全 ， 


(二 ) 先 验 分 布 的 确定 


人 


这 是 采用 贝 叶 斯 方法 最 关键 的 一 步 ， 从 征 理 了 2 知 下 列 道 五 
布 @， 


嘻 


N 


e0) 一 下 Ore e 《00) 《4. 6) 


是 Poisson 分 布 (4. 3) 的 共 斩 分 布 ， 其 中 250 是 正 数 . 
实际 上 , 若 取 (4. 6) 为 0 的 先 验 分 布 密度 , 则 在 失效 数 ”一 & 的 


了 7 LA AZ Ai 3 


条 件 下 ,0 的 后 验 分 布 密度 为 
eCg| 有 ) 一 让 二 本 0 crtDer 红 (4.7) 


| 也 < 
2 丁 忆 ) 


故 取 (\446) 为 0 的 先 验 分 布 . 怎样 确定 4 忆 呢 ? ab 的 直观 意义 不 


明显 . 但 先 验 分 布 的 均值 已 6 及 10% 分 位 数 和 ( 即 有 P(0 委 4 ) 王 
0.10) 有 明确 的 直观 意义 ， 有 下 列 关 系 式 : 


 . 


(4. 8) 





开 O 一 - 


太 
| 1 Reedg 一 0.1 C4. 9) 


若 能 根据 历史 数据 近似 估计 出 下 6 及 和 , 则 从 (4， 8) 和 (4. 9) 
就 可 可 求 出 4 0. 


| HR。 


的 寿命 数据 进 和 了 胃 查 ( 包 拓 娄 所 和 有 人 用 玫 所 妈 过 
多 次 研究 ,将 产品 按 寿命 分 成 三 级 ,分别 记 为 P.Q.、R; 然 后 根据 管 


WA 9 挛 A ~ 2 _Av LA 人 


理 经 验 和 有 历史 数据 确定 每 级 产品 的 0，0 EN 比 & 一 3. 
P,Q,R 三 级 的 0 分 别 定 为 15 000,20 000: 和 30 000 h, 根 据 历 史 
数据 , 取 开 6=30，P,Q,R 三 级 的 0， 分 昂 


荔 人 中 9 “人 JUlI。 9 9 二 .二 从 别 为 0 V 。 


750 ,0. 900 ， ， 


@ 称 ? 服 从 邀 下 分布 , 若 六 ! 服 从 一 分布 


0.950. 以 卫 级 为 例 ., 取 忆 bg 一 30 一 45 000;0 一 0.750| 一 11 250， 


再 利用 (4. 8) 4. 9) 经 计算 机 算得 先 验 分 布 中 的 两 个 参数 如 下 : 
za 一 1.956，p0 一 2.868 


对 Q 级 ,R 级 可 进行 局 样 的 计算 ,总 之 得 各 级 所 需 的 参数 如 下 表 


参 数 MTBF( 平 均 寿命 ) 先 验 分 布 参数 





in 一 内 了 hn 


Nt WA ea 二 Wo 
合格 ; 当 r>C 时, 则 判定 批 不 合格 . 工 ,C 如 何 确 定 ? 应 使 后 验 生 
产 方 风险 w ”及 后 验 使 用 方 风 险 8 都 达到 指定 的 水 平 , 这 里 
.=P(Gb |r>>C) 
8 王 P(O 委 ] | r 委 C) 
可 以 证 明 有 下 列 计算 公式 : 
定理 4. 2 


r(“ 下) 


二 4 让 是 一 0 














其 中 Ta,z) 三 -| 六 e 业 是 不 完全 工 盟 数 ,而 
。， 388 ， - 


Pdr 返 Dj Poes C)8(b)dg 


PCe 十 外 1 了 工 
. = (证 了) 六 TCD)RI [有 
是 接收 概率 ,这 是 一 个 无 条 件 概 率 , 表 示 0 的 先 验 分 布 为 (4. 6) 时 
产品 被 接收 的 概率 . 
证 明 : 
总 _P( 志 0 ) 广 盖 亿 ) 
P(Ob) 一 P(Ob,r 委 C) 
PCrC) 


P(p %)=| e(b)d0 一 | ”grcetDe- 和 db 
b 4 工 (a) 


六 | a 一 ] 6 一 : 
下 Fa di 
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、 司 
0 ) Fr(a 十 二 工 二 2) 
1 \] ) / 


所 十 
由 此 知 (4. 10) 成 立 ， 同 理 知 (4 11) 成 立 . 证 毕 . 


对 于 己 级 产品 ,0 王 15 000,a 王 1.956,0 一 2. 868, 取 8 一 
必 38409 全 


了 十 . 
0 过 三 
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.10, 由 公式 (4. 11) 可 算出 几 组 (T,C) 的 值 , 再 由 公式 (4. 10) 计 算 


I 王 一 计 


站 AP 
相应 的 后 验 生 产 方 风 险 ca” , 得 下 表 : 


,了 王 级 产品 的 贝 叶 斯 方案 





好 人 000, 是 原来 的 经 典 刀 全 日 
T 一 100 000 的 37% ,这 就 大 大 减少 了 试验 工作 量 . 对 Q 级 .R 级 
产品 也 选 定 了 验收 方案 ,总 结 在 下 表 中 
验收 试验 方案 表 
SS (CT，C ) 方 案 | 
T/ 台 时 C( 合 格 判定 数 ) 
级 别 
37 000 2 
CO 32 000 2 
尺 20 000 1 





[| 上- 通过 实例 介绍 了 如 何 运 用 贝 叶 期 方法 计 滋 风 联 系 AA 
入 上 迪 这 关 DJ 放 有 有 /有 入“ 月 让 9 


中 的 内 容 加 冻 对 册 叶 斯 方法 的 了 解 . 


在 上面 的 证 合 中 口上 有 具 利用 上 生 验 从 布 和 户 难 分 在 土 确 证 
任 二 HR 六 CT ， 人 和 正人 7 靖 妃 妈 用 布 和 后 验 分 布 羡 钙 和 目 


验方 案 ,使 得 后 验 生 产 方 风险 w* 及 后 验 使 用 方 风险 8* 均 达 到 指定 的 水 平 
(8: =0. 10,a* 委 0.05) ,并 没有 去 追求 “ 贝 叶 斯 决策 ”一 一 “风险 ”最 小 的 验收 
方案 . 要 获得 贝 叶 斯 决策 ,只 知道 先 验 分 布 还 不 够 ,还 必须 知道 损失 函数 是 
怎样 的 . 在 制定 验收 方案 时 ,选取 生产 方 和 使 用 方 都 同意 的 损失 函数 并 不 是 


人 僻 前 的 圳 由 于 较 难 确定 “客观 ”的 损失 四 上 数 , 人 们 常常 不 去 追求 贝 叶 斯 决 
1 区 [同人 蔡甸 丰 昌 术 信 因 和 ?AN 有 市 外 天 所 水 入 开罗 [六 


策 了 . 当然 ,一 旦 选 好 损失 函数 , 则 应 该 追求 贝 叶 斯 决策 . 以 上 面 的 电视 机 
人 @ 300 万 
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CC 
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2 村 6 Eee 1F 
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验证 试验 为 例 , 如 果 损 失 函 数 是 0 - 1 损失 , 则 不 难 求 出 相应 的 贝 叶 斯 决策 . 


目 体 介 绍 如 下 : 


Si 7] 一 上 AH 


泊 用 正文 中 的 各 种 记号 . 检验 问题 是 : 


HT, ;00 万 | ;6 《6 二 0 ) 


达 中 曲 @wWA ULU ”了 有 2Vm 人 Vi W ww 1 Z 


届 和 1 村 动 空间 A 一 (aliyaz } /al 表示 “接收 2( 即 接受 假设 万 。) ,as 表示 “ 拒 收 ” 
( 即 拒绝 假设 瑞 )， 损 失 函 数 L(b,a) 如 下 : 


0，p0>6 
| 
1， 0 儿 0 
[1 0 之 思 
1 
0， 0O<bo 


仍 取 (〈4. 6) 为 0 的 稳 验 分 布 密度 ,其 中 参数 ac, 的 确定 方法 见 正文 . 
设 工 是 试验 的 总 台 时 数 \《 有 蔡 换 的 试验 ),y 是 试验 截止 时 的 累计 失效 
数 . 从 定理 4. 2 的 证 明 过 程 知 


站 人 ] 人 a 十 1 一 ! 
P(b 之 b|7 一 ) -| t e di 
TH 
/1 ja 二 1 e 一 : 
P(b 委 0 |7y= 旬 一 人 di 


(0 
利用 微分 法 可 以 证 明 P(bb | > 一 提 是 天 的 减 函 数 ,从 而 P(O 委 0 | >= 
&) 是 的 增 困 数 . 故 对 任何 非 负 整 数 C 有 


inf P(0 | > 一 急 一 P(O 辫 b% 17=C) (4. 12) 
sup PCO >b | 7 一 扩 一 PCO >p | 7 一 C 十 1) (4. 13) 
SupP(b<4 | > 一 太一 PC 入 | 7 一 C) (4. 14) 
inf PC <4 | > 一 已 一 P(O 委 6 | 7 一 C 十 1) (4. 15) 
我 们 指出 ,对 任何 非 负 整 数 C, 必 有 T=T(C) 使 得 
P( 三 b%|17y=C)=PGO 过 0 |7y=C) (4. 16) 
实际 上 , 令 


d R 
p(T) 一 Pb 过 gp|7y=C) 一 PG 委 和 |7y=C) 


T+b 


12+C 1 一 上 
-二 | 人 


六 二 
十 二 e di 一 1 


人 
显然 2 了 是 工 的 严格 增 连续 上 基数 ， ee 1],p(co) 王 1, 故 有 了 工 三 


人 7 Am、\ (二 4E7AH4 TAN 一 
了 (CC) 使 得 (4. 16) 成 芯 ， 


给 定 C, 设 试验 的 总 台 时 数 为 T=T(C) ,> 是 累计 失效 数 . 今 


at， 当 7y 生 C 
0” | 省 yc 
我 们 来 证 明 ,9* 是 贝 叶 斯 决策 . 
设 562|R) 是 失效 数 为 上 时 0 的 后 验 分 布 密度 ,具体 表达 式 见 (4.7). 显 


然 有 


inf | LOa)EGCO 民 )dO 
刘 。 
一 min{P(8 妥 0 17 一 人 ,PCb 定 6 | 7 一 )) 
和 PG 过 和 7 一 旬 ， 当 & 委 C 
[LP(p 三 %m|y= 有 有; 当 &>C 
另 一 方面 , 当 7 一 & 时 6"* 的 后 验 平均 损失 

P(0 入 |7= 有 外， 去 C 
| L(6,8CD)6Cb|E)dg 一 
J。 LPG 过 儿 |7y=A，A>>C 


ER 
一 Ini| 上 (0a)SCOIR7IdO 
这 表明 9 "” 满足 (2. 2) , 故 '3S” 是 贝 叶 斯 决策 . 


在 实际 工作 中 要 求 试 验 的 总 台 时 数 尽 可 能 地 小 ,因而 C 应 该 取得 很 小 . 
通常 取 C=0,1,2， 相应 的 总 台 时 数 四 16) 确 定 . 





1. 设 和 是 离散 或 连续 随机 变量 ,EX 人 存在 . 试 证 明 : 为 了 使 忌 ( 和 一 a) 


人 四 
5 


(3 


(a 是 实数 ) 达 到 最 小 值 ,必须 且 只 须 一 下 X. 


上 mFr 乓 一 PP vvA A 二 


门 已 万 [mv 蕊 FS JE 有 万 -六 ~ 下 日 于 
C。 设 科 是 离散 或 连续 随机 变量 , 达 X 4 人 人 性 。 JR / 


IIL 所 7 可 三 有 万 四 -rr 站 YN -页 … 央 广 上 NM 一 二 一 
3 妈 AI 上 2 人。 是 来 目 Fotsson 分 布 的 件 布 ， 


二 RS 人 一， IO 
ee (4 一 0 二 0， ) 


设 ) 的 先 验 分 布 是 参数 为 ,8 的 卫 分 布 ,损失 枉 数 是 人 一 a) ， 试 求 的 贝 叶 
斯 估计 . 
4. 设 XXX。 5 是 来 自 伯 努 利 分 布 的 样本 ， 
己 ( 有 ,一 1) 一 0 一 1 一 PXI 一 0)， 0OE(40，1) 
设 6 的 先 验 分 布 是 (0,1) 上 的 均匀 分 布 , 损 失范 数 是 





试 求 2 的 贝 叶 斯 估计 . 
5. 设 X ,Xs，…，X。 是 来 自 正 态 分 布 N(0,1) 的 样本 ,2 是 未 知 参 数 . 给 
定 检验 问题 : 
:Op 二 万: :0 盖 0 
用 a; 表示 “接受 假设 五 ;”( 一 1,2). 设 损 失 郴 数 如 下 : 
0， 0O 委 b 
&(O 一 b)， 0>>b 
[有 | 0 一 了 | ， 6 委 b 


1L(b,as ) 一 
0， bb 


其 中 & 是 正常 数 . 和 奉 0 的 先 验 分 布 是 N (po ,cs ), 试 求 出 贝 叶 斯 检验 . 

6. 设 Xi，X:，…，X 是 来 自 N(O1) 的 样本 ,bgE (一 coco)， 
A4 王 (一 co,co), 损 失 了 本 数 世 (0,a) 一 克 (|10 一 a| )(aEA), 这 里 殉 ( 纺 是 LO0，,ce) 
上 的 增 函 数 , 克 (0)=0. 着 0 的 先 验 分 布 是 N(0, 叶 ) , 试 求 出 0 的 贝 叶 斯 估计 . 
如 果 单 次 观测 的 费用 为 C( 正 数 ), 问 :样本 量 取 多 大 最 好 ” 

7. 地 质 学 家 要 根据 某 地 区 的 地 层 结 构 来 判断 该 地 是 否 理 藏 石油 . 地 质 


结构 总 是 0,1 两 种 状态 之 一 ;用 6 表示 该 地 无 油 ,9 麦 示 该 地 有 油 . 已 知 有 


一 1 一 7 了 站 VAN VIA 一 六 V0O 议 人 必 地 无 泣 ，0 水 7/ 门 1HI， 


下 列 概率 分 布 规律 (其 中 z 表示 地 层 结构 的 状态 ,9 表示 石油 的 状态 ) : 


ee 303 。 
AAA WA 


| 
| 


并 0 1 
0 (无 油 ) 0. 6 0. 4 
0 (有 油 ) 0. 3 0. 7 


它 表 示 如 果 该 地 区 无 油 ,那么 地 层 结构 呈现 状态 0 的 概率 为 0. 6, 呈 现状 态 1 


的 概率 为 0.4; 如 果 该 地 列 藏 石油 ,那么 地 层 结构 呈现 状态 0 的 概率 是 0. 3， 
坚 现 状态 1 的 概率 为 0.7. 土地 所 有 者 希望 根据 地 岳 学 家 对 地 层 结构 的 分 析 


决定 自己 投资 钻探 石油 ,还 是 出 卖 土 地 所 有 权 或 者 在 该 地 区 开辟 旅游 点 ,分 
别 记 这 些 行动 为 Cl19?C2 9 Ca3 -。 行动 空间 A 一 《ai ? CL2 9 人 3 ,土地 所 有 者 权衡 利弊 
之 后 取 损 失 函 数 工 (0,a) 为 










~ 上 (2a) 42 
0 人、 人 | 和 目 己 投资 钻探 ) | 《出卖 所 有 权 ) | 《开辟 旅游 点 ) 
bp (无 油 ) 12 ] 6 


产子 人 


竹 ”7 下 一 ww mw 
有 月 圳 7/ U / D 





试 写 出 可 供 土 地 所 有 者 选择 的 全 部 决策 (图 数 ) 及 其 风险 . 求 出 minimax 
决策 . 若 0 的 先 验 分 布 是 :上 (6 ) 一 0. 2,6(6 ) 一 0. 8 , 试 求 出 贝 叶 斯 决策 . 





第 作 章 扫 科 调 查 笨 


S 1 问题 的 提 
抽样 调查 亦 称 大 规模 抽样 调查 ,是 


2 其 应 用 极 革 广 党 于 论 且 了 玉 [ 哇 训 | 门 
全 9，? 斌 扣 / 用 忆 太 上 人 和 儿 辽 征 避 /RhiJ 、 


研 单 位 或 其 他 部 门 ,在 制订 计划 .开发 产品 、 机 Ada 


和 名 位 自 汪 瑾 右上 源 提 不 六 AH 7 和 售 ER 列 此 尖 和 
2 悬 . 司 : 和 人 有 佣 日 多 TEA 八 几 记 有 ,就 要 进行 调 碍 ', 收集 寺 TI 昌文 人 


据 . 各 种 各 样 的 调查 主要 可 分 为 全 面 调查 .典型 调查 .概率 抽样 
苦 查 三 大 类 . 全 面 调查 也 称 普 查 , 如 我 国 若干 年 一 次 的 人 口 普 
查 . 这 类 调查 需要 大 量 的 人 力 、 物 力 和 上 时间. 典型 调查 是 我 国 过 


去 用 得 比较 多 的 调查 方法 ,需要 有 明确 的 先 验 信息 ,也 就 是 必须 
事先 知道 所 调查 的 样本 确实 是 典型 的 ,否则 所 得 资料 无 太 大 意 
义 . 典型 调查 一 般 取 样 较 少 ,但 无 法 客观 地 估计 所 得 信息 的 精 
度 . 概率 抽样 调查 是 引入 概率 统计 原理 的 一 种 调查 方法 . 1935 
年 英国 统计 学 家 Fisher 在 选择 样本 单元 时 引入 了 随机 化 ,利用 这 
种 方法 ,不 但 可 获得 总 体 的 量 的 估计 , 厕 且 对 这 些 估 计 可 估 出 其 
可 能 的 错误 . 今天 在 概率 统计 原理 指导 下 ,针对 实际 情况 的 、 合 
理 的 概率 抽样 方案 多 如 繁星 . 利用 它们 既 可 获得 可 靠 的 信息 ,又 
可 大 大 节约 调查 的 人 力 、 物 力 . 时 间 . 概率 抽样 调查 已 成 为 抽样 
幸 有 中 的 主要 方法 . 实践 中 常 将 这 三 类 调查 配合 使 用 . 

传统 的 概率 抽样 调查 的 理论 ,是 考虑 从 一 个 由 有 限 个 单元 组 
成 的 总 体 中 ,抽取 一 个 样本 ,根据 样本 估计 总 体 的 一 些 指 标 . 设 有 


让 和 7vTT 上 喇 上 单元 . 也 为 


CN) 王 (12 》C2 ZN } 


法 
数理 统计 的 一 个 重要 内 
商业 机 构 、 工 矿 企业 、 科 


(9 
《CC) 
CD 


每 一 单元 有 对 应 的 指标 值 , 故 有 六 个 指标 值 : 

本 (Yi Yazy， 六 
认 小 彻 N 涉 单元 中 搬 季 ， 个 单元 (us ,ao ,as ) 作 为 样本 ,对 样 
本 的 各 单元 测量 指标 值 , 得 相应 的 指标 值 , 记 为 


(、，，AJ。， sse。 》 
\J19.y2， 9 .yn 7/ 


(yi ，ys yy) 是 (YY YN) 的 一 部 分 . 根据 (yy yz ，……，y，) 
(| 、L Ma (TAO 
1OD 还] 村 吕 JJ 甩 
一 1 二 
一 入 YITY2T” 十 NJ) 


节 一 盖 十 YY 十 … 十 YN 
等 数量 指标 ,并 研究 估计 的 可 能 偏差 . 
f 这 里 除了 要 确定 佑 计量 外 , 另 一 一 个 重要 的 问题 是 如 何 抽取 样 
本 的 半 个 单元 ,也 就 是 一 个 抽样 计划 包含 设计 一 个 如 何 取得 样本 
单元 的 方案 以 及 确定 相 适 应 的 估计 量 这 两 个 重要 内 容 . 
一 个 完整 的 抽样 调查 除了 有 一 个 抽样 计划 外 ， 也 涉及 大 量 的 

现场 调查 的 实践 和 组 织 工作 . 整个 调查 大 致 有 下 述 内 容 : 

A， 明确 调查 的 目的 

B.， 调查 的 锥 备 阶段 


合体 的 确定 口 口 7 FEI 一 三 上 上 一 EL 


， 心 全 昌 钠 自 ， 因 俩 现 华 昌明 你 旦 


9 明确 抽样 框 ( 即 总 体 各 单元 如 何 与 数码 1,2,…,N 建立 对 


寻 
水 
由 CD 兴 CPP “ 挛 


Se 


1 国 太 | 淘 
人 俘 19 下 


. 现场 测量 阶段 


六 了 EI 疡 TOG IAA EL 


. 数据 处 理 阶 段 


. 估计、 分 析 


4 
AD 
Cn 


王 . 恕 绪 报 告 ' 


YA 7 -3 上 MA AMPEI 一 人 一 一 /rr HE ~ A_ 一 上 二 LA Ti 一 Et TS -~ 
-一 从 元 夫 时 夫人 件 网 人 笃 人 小 人 女人 一 汪 计 的 招 御 了 迎 ， 二 正之 有 有 
良好 的 组 织 工 作 、 正 确 的 测量 手段 ,每 一 步骤 都 应 一 丝 不 苟 ， 否则 
将 会 招致 调查 的 失败 . gradeiekonpaewsoien 
抽样 误差 . 抽样 设计 主要 是 应 用 概率 统计 原理 尽 可 能 地 减少 抽样 
误差 ,而 组 织 工 作 的 疏忽 .测量 手段 的 低劣 将 会 使 测量 失 淮 、 数 据 
季 和 和 启 了 4 狂 和 刘 生 和 针 省 站 赴 梯 浊 关 上 大 博 H 佳 县 户 的 化 计 丛林 
< 和 YL HH PP 可 -FJHJHN 六 NA 月 JJHN 9 LA 二 7/ 上 JJ TH YA AI 
去 意义 . 
4 了 IT Ye 十 hh 和 HH -人 4 全. 一 ~- 县. 的 单元 二 hh Ho 册 A 二 - 林 - JE HH 
概率 抽样 调查 中 总 体 一 般 包 含 大 量 下 电 J-]L9 ID 一 
是 相当 大 的 ,因而 估计 的 相合 性 是 一 条 重要 的 ， 对 抽样 设计 
中 估计 量 的 最 基本 的 准则 大 致 可 总 结 如 下 ee 窑 入 作 . 


再 (六 ) 一 五 ( 市 一 ) 一 下 让 一 本 
称 为 伍 量 . 
(人 访 ) 一 下 (六 一 夯 ) 六 一 Var 页 十 | 下 讽 一 厂 

称 为 均 方 偏差 或 均 方 误差 . 

(1) 样本 量 增 大 时 , 偏 量 与 均 方 偏差 应 同时 变 小 ( 符 六 一 ce， 
则 ”~ce 时 , 偏 量 与 均 方 偏差 均 收 敛 到 0), 且 偏 量 比 均 方 偏差 的 平 
方 根 变 小 得 更 快 . 如 此 ,估计 量 是 相合 的 , 且 Var 廊 可 近似 作为 均 
方 偏 差 . 这 样 的 佑 计量 称 为 可 用 的 . 


(2) 比较 两 种 估计 的 好 坏 ,以 它们 的 均 方 偏差 的 大 小 为 准 , 培 
方 偏差 小 者 为 佳 . 


从 可 体 ,1， .，， 由 抽 本 样本 昌 交 ， 的 一 个 样 本 生 次 
AN 届 人 \ 人 CI9C2? UN 于 向 居 人 作 人 时 /7 有 9 | 何人 LN 
抽取 对 总 体 中 各 单元 有 相等 的 被 抽 中 概率 , 且 抽 取 是 不 放 回 


YA YL wma 一 人 上 1 久 了 FJ -DA 人 二， TI 个 


即 第 一 次 对 总 体 中 各 单元 以 1/N 的 概率 抽取 一 
单元 不 放 回 ,对 剩 下 的 六 一 1 个 单元 以 1/CN 一 1) 的 相等 概率 抽取 


第 二 个 样 单 元 ，……: , 如 此 继续 ,直至 抽 满 个 样 单元 . 这 样 的 抽 


。397 。 


样 方法 通 向 称 为 简单 随机 抽样 . 但 它 与 本 书 前 面 章 节 中 称 为 简单 


二 Te -本 和 hh IE LA -2 -一 0 AL -本 -8 一 HH -ar 
随机 样本 的 独立 同 分 布 本 ME 它 的 征 本 单元 间 不 相互 独 工 . 


为 子 加 以 区 分 ,以 下 我 们 将 这 种 无 放 回 的 等 概 抽样 称 为 单纯 随机 


抽样 : FinisegN5eWiP 和 
均 相等 ,为 1/CA: 


单纯 随机 抽样 是 抽样 调查 中 最 基本 的 抽样 方法 ,其 他 复杂 的 


抽样 方法 往往 以 它 作为 基础 ， 当 我 们 对 被 调查 的 总 体 知之 甚 少 ， 
没有 什么 信 妃 可 以 利用 时 ， ,往往 采用 单纯 随机 抽样 . 


引进 一 个 与 抽样 设计 有 关 的 函数 
| 当 单 元 tu 进入 样本 
0， 当 单 元 妨 未 进入 样本 
引 理 2.1 对 单纯 随机 抽样 法 ,有 


二 一 一 -一 国 图 国 
忆 t 一 二 一 和， z 一 ]， ， 八 
本 0 一]) 人 
有 二 1 已 二 上 二 NON， 1 天 71， 7 一 1 人 N (2.1) 
证 明 :在 单纯 随机 抽样 下 ,从 六 个 单元 中 取 2” 个 单元 的 一 切 
可 能 的 情形 有 Cy 种 ， 它们 有 相等 的 出 现 概率 ， 改 由 训 典 概率 的 算 
人 








通过 简单 的 计算 ,可 得 
Eee 下 

上 (Pa 一 N， Var( 坟 ) 人 村 

AN 


] ) 


二 17 一 了 7 
下 ( 忆 中 ) 王 CNE1y》， 


Cov(D,,D,)== | 


7 
-NONEDU-N 
1 天 1 一 1 ,和 N (2. 2) 
上 述 单 纯 随 机 抽样 为 保证 每 次 抽取 对 各 单元 是 等 概 的 ,可 利 
用 随机 数 表 .计算机 中 的 随机 数 或 随机 贫 子 等 来 实现 . 
例 2.1( 用 随机 数 表 实现 单纯 随机 抽样 ) 调查 某 一 城 镜 居 民 
用 于 食物 的 文 出 .该 镇 有 居民 共 345 户 . 以 户 为 调查 单元 , 拟 从 
345 户 中 抽取 20 户 作 样 本 . 用 随机 数 表 作 单 纯 随 机 抽样 . 首先 按 
户籍 册 的 半 订 顺序 给 每 户 一 个 对 应 的 编号 ,号码 从 1 至 345. 然后 
取 一 随机 数 表 ,从 中 任 取 三 列 构成 三 位 的 随机 数 , 逐 行 依次 取出 不 
同 的 三 位 数 . 可 规定 当 数 在 001 一 345 之 间 , 则 对 应 的 号 码 进入 样 
本 ; 当 数 在 401 一 745 之 间 , 则 该 数 减 去 400 对 应 的 号 码 进 入 样本 ; 
随机 数 表 . 


46 98 63 71 62 33 26 16 80 45 60 1l1 14 10 95 
42 53 32 37 32 27 07 36 07 51 24 51 79 89 73 
32 90 79 78 53 13 55 8 97 54 14 10 


05 03 72 9%3 15” 57 12 10 14 -21 88 26 49 8l1 76 
31 62 43 09 90 .06 18 44.32 53 23 83 01 30 30 


43 84 26 34 91 64 
25 83 9%2 12 06 76 
98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 
52 42 07 44 38 15 51.00 13 42 9%9 66 02 79 54 


49 1 46 09 62 90 52 84 777 27 08 02 73 43 28 


9 rm、 有 4 pm 呈 ae 7 mm 


Eee ee 天 2 的 


/9 83 86 19 62 00 /6 50 03 10 oo L 人 L 64 0b 0o 
83 11 46 32 24 20 14 85 88 45 10 93 4 88 7 
0 45 32 14 08 32 98 94 07 72 93 85 /9 10 75 
OU 5 /6 3l1 38 80 2 人 042 53 53 860 60 4 04 953 
44 34 017 .96 88 94 4 06 87 98 359 85 29 48 39 


]3 89 951 03 74 ]7/ /746 3 13 04 07 4 <41 19 39 
9 1< 25 93 47 0 33 44 03 54 97 7 46 44 80 


]6 04 36 16 00 0o4 43 18 66 ”79 94 1 24 21 90 
34 45 99 27 72 95 14 


ee Sr Er 瑟 aa ee 


D9  、 3 
<20 15 37 00 49 52 85 66 60 44 38 68 88 1 80 
。 了 了 99 。 


其 余 的 000 ,346 一 400， 746 一 999 不 要 | 当 某 号 码 已 进入 样本 , 而 再 


VC TD 7 \ 一 口 口 NT iv 上 站 一 上 一 TY 人 信人 广 


议 磁 到 该 号 舍 时 ， 则 只 算 一 次 ， 容易 证 明 当 随 宙 数 表 中 号 码 000 一 
999 每 一 一 号 码 出 现 的 概率 为 1/1.000 时 ,如 此 得 到 的 样本 是 单纯 随 


et 


杭 样 本 . 如 用 下 列 随机 数 表 取样 ， 先 随意 取 三 列 , 此 处 取 849、10 
三 列 , 第 一 个 数 为 162, 则 162 奥 进 入 样本 . 第 二 个 数 为 732, 减 去 


荔 A AS LOCALUC 本人/ 八 全 人 人 必 一 (已 7VY 公 
400: 为 332,332 号 进入 样本 为 第 二 个 样本 单元 :第 三 个 效 为 .853， 
杂 十 嫩 TH ATE nm ao 户 挟 :人 -LA 一 人 信 证 -二 
总， 放 扑 | AL UV9A 人 人 LV 号 进 人 样本 为 第 三 . 1 4 人 -二 7] UL 


如 此 继续 ,可 得 .178,038.,224,008,138,288 ,200,049 号 进入 样 


来. 8.9、10 列 随机 数 已 焉 完 , 入 样 的 号 码 仍 不 足 20, 财 转 人 
一 列 继 练 取 、 如 利用 18、19、20 三 列 , 则 继续 得 045 ， 


ee [ 


243,025,342,327,310,304 号 进入 样本 . 取 满 20 个 样 单元 即 
依 路 
及 外 ,实际 工作 中 和 常 使 用 一 种 称 为 系统 抽样 的 技术 ,按照 固定 
闻 陋 选取 样本 单元 . 如 按 编 号 的 系统 抽样 可 选取 一 正 整 数 &, 在 号 
码 1,2,…, 中 ,随机 地 取 一 个 数 , 若 号 码 ;进入 样本 (1 委 ; 委 有 )， 
则 ;& 十 1,2R 十 i,，… 皆 进入 样本 . 又 如 调查 顾客 对 某 一 商品 的 态 
度 ,在 商店 门口 等 待 顾客 ,每 隔 10 分 钟 访 问 一 位 顾客 ,这 种 抽样 常 
稍 非 常 简便 . 当 总 体 中 各 单元 的 编号 是 完全 随机 时 ,系统 抽样 可 


看 作 单纯 随机 抽样 . 
定理 2. 1 契 (y 2 ,ys) 是 从 《到 2， ,YN} 中 抽出 的 单 
纯 随 机 样本 , 则 
尺 二 二 y (2. 3) 
3 
是 立 = 和 的 无 偏 估计 ， 其 均 方 偏差 为 


Var(3) 一 = 一 (1 一 避 )S: (2. 4) 


时 


-~ 


证 明 ; 


2 人 了 
] 人 ] 人 
OO > 
7 ;= 一] 1 一 1 
人 





N 
- 工 | YYvvar(D) 二 SIyy Cov( 万 D | 
人 到 
N 
| 
7 LIVAN 人 
7 7 ?2 NA 
二 之 之 /了 | 
i 
开刀 ( 1 一 于 1 了 ] \ Sr 
二 NI 儿 0 二 
7 (1 五 (SN 
NIN 二 TD NAACZO) 


过 
长 


系 2.1  N 是 了 = 六 的 无 偏 估计 . 且 


js 


入 
VarCN2= 到 (1 一 


ah 


定理 2.2 在 单纯 随机 抽样 下 
0 (2.5) 
1 NA 太 


上 


(mm 


] 


二 0 
:2 一] 








证 明 :只 需 证 克 5 一 9 . 


二 Li[ 2 一 1(y | -二 [rp 一] 














1 『「< 
| 
1 一 上 L 7 二 - 
人 人 
__ 1 [ay _ ,1L11 -sf(LSYNT TY] 
7 一 LN LN NI/) NS /1 
| 
7 一 LN \ 入 
一 人 证 毕 
定理 2. 1 及 和 定理 2. 2 告诉 我 们 ,在 单纯 随机 抽样 下 ,用 
估 了 (Ny 估 YY) 
这 种 估计 的 均 方 偏差 Var(7) 一 一 (1 一 总 )S?， 这 一 估计 是 可 用 
的 日 均 庆 信 差 在 仕 计量 CT 一 上 (1 一刀 3 
FA JJ LA VC 有 门 IN 7 志 \、 7 1 人、 凡 。 


例 2.2( 例 2. 1 继续 ) 对 进入 样本 
月 文 出 ,得 数据 如 下 (单位 :元 )， 

142 163 142 165 146 178 228 

188 169 165 262 163 195 182 


计算 得 
了 一 76.6， 5% 一 820. 57 
根据 上 述 估计 法 ,估计 该 镇 平均 每 户 的 月 食品 支出 为 176. 6 元 
这 一 全 计 的 标准 偏差 的 估计 为 
Vmum( 了 ) 一 /二 Is ): 二 | 一 总) )(820 57) 
一 6.2( 元 ) 


8$3 区 间 估 计 与 梓 本 量 的 确定 


利用 估计 量 的 近似 分 布 , 可 对 了 做 区 间 估 计 , 其 理论 基础 
是 下 述 Wald-Wolfowitz 定理 . 


季 


AT 一 (1 9I 
HH 


= TEA 1 31 \ CI 二 .上 御 TE 
人 已 上 主 。) 。 上 以 人 CNI1 9 ”9 CNN .LNN19LY 一 上 9 一 人 E 沁 


和 {zn 
个 实数 序列 的 集合 ,满足 ;对 * 一 3,4,…: 及 大 的 N ,有 


页 (CaN 一 GN) 


亚 -4 -一 (1 
由 网 | 
1 
d 人 
(z 二 工 》 1 
\ 六 宁 ~) 
] 人 
2 = 
一 (OO(] ) 


d 加 RE 
(二 二 2 ss) 对 每 一 人 (AAAN) 征 取 但 为 (ZN，， 


ZzAN) 的 排列 的 均匀 分 布 随机 癌 量 . 又 记 








工 -osx 
< 人 人 此 夭 
则 
下 (LN) 一 NaNZN 
ES  N _ 
Var(CLN) 一 枚 3 一 CN 人 )2 | 
NA 本 中 
且 
LN 一 下 (EN) < 
P| sz| 一 -| eu CN 一 co) 
UL WVaTALN/ | A/ ZTCv 一 c 
证 明 简 介 : 此 和 定理 证 明 中 有 细致 的 计算 . 细节 可 参看 A. 


e。 403 。 


Wald and J. Wolfowitz (1944) ,Statlstical tests based on permuta- 


0 2 上 三 1 
LILUIIS of the observationsy Ann: :Math. Statlst， 9 WV UL 5 


"PEP， 


记过 ER 
2 9 
郊 记 (em 一 QN) 上 
1 
/ 之 加 
这 一 1 N 工 
2 
[> 三 )2 
LN 


可 证 {aNi，…,aNN } 和 {z 侣 ZNN )} 满足 定理 中 的 类 似 的 条 件 ， 
又 (Xi XXXN) 是 取 值 CzmN CNN ) 的 排列 的 均匀 分 布 随机 回 


量 . 令 
八 
] 
则 
已 (LN) 一 0 
下 J  _ JrT 


_ 七 N LN 一 下 (LN7) 


ACE V Var(LN1 
经 细致 计算 可 得 ,对 整数 >， 


/ 后 N 二 oON )， 当 5 一 2 
局 
YY RATAAY ye -一 0D7_L1 
ONLY 7 | CA | 


因此 
E( LN ) = 人 (2 
VMVar(CLN) MAVar(CLN) ， 


鲜 ” 


(26)! 
2 1 当 5 一 人 (Noco) 


0， 当 * 王 24 十 ] 


即 N->po 时 ,[LN 一 ECLN)]AXVarCIANV) 的 5. 阶 矩 收 伍 到 标准 正 态 
。404 。 





随机 变量 的 * 阶 矩 ,因此 [LN 一 已 (LNw)] 人 AAAVarCELN) ,有 极限 分 布 
No,1D， 

利用 此 年 理 ,把 (YY ,…, YN) 看 成 {aN axwv)y N 一 1,2，… 
序列 中 的 一 个 ,而 


”1 mA 
\ 人 二 NI 9 9 ZNNIJ/ 一 人 上 99 9 U9 9U) 


上 全 >0 时 ,[7 一 到 AAAVar(Cy) 有 近似 分 布 NO0,1). 又 总 体 的 
四 阶 和 抵 六 > Y! 有 界 的 话 ， 





站 和 /vd ] 且 的 四 人 位 诺 浴 1”” 的 友 站 | 
PPFLyY ”VSV TY] YYTUSVYTIyYL 下 HHJ 甩 上 弃 /上 Qa 吧 这 扣 
估计 
4 ro 1 D D Ah At -七 HE 一 be /一 下 天 F 站 II 一 me 轨 YI 上/ 
四 > DLL 多头/ 和 生 女 冰 TFEI 承 后 请 地 厂 记 天 过 
食品 支出 的 0. 95 置信 和 度 的 区 间 依 计 . 则 查 出 标准 正 态 分 布 的 1 一 


了 一 xVz(7) 一 176.6 一 (1.96)(6.2) 一 164. 4( 元 ) 
7 十 xxWu(7) 一 176.6 十 (1.96)(6.2) 一 188.8( 元 ) 


所 求 的 0 CE 由 万 EL 人 FREECA BE FI 1A 4 Te ao | 
站 小 HHJVv vv HHJ 书生 达 有 JJ 和 抽 上 9 ALLOT 二 9 上 OO OO 下 


在 设计 抽样 调查 方案 时 , 取 多 少 个 样本 单元 是 一 个 重要 问题 . 
样本 量 的 大 小 与 抽取 样本 的 方法 以 及 对 佑 计量 的 精度 要 求 密切 相 


。405 。 


浆 . 利用 正 态 分 布 , 可 粗略 确定 在 单纯 随机 抽样 下 为 保证 估计 了 > 


PR 人 内 产 业 二 中 EE TS -一 后 大 E 攻 关 记 本 上 二 一 _E 《二 -EL 六 凿 二 FF 岂 


过 到 一 年 的 精度 要 求 所 需 的 样本 量 . 佑 计量 的 精度 的 提 法 ,通常 


和 


布 望 
< 0 本 定 的 置 


1 二 一 一 一 一 《5 2) 





当 六 很 大 时 ,可 简化 为 
(3. 3) 
相对 精度 要 求 :给 定 相对 精度 ,在 置信 和 度 1 一 xc 下 ,要 求 


P|| 冰 | < IE 











ko) 


以 上 的 式 子 中 的 $ 和 C 实际 上 是 未 知 数 . 因而 要 确定 ” 必 


一 性 一 2 六 1 二 jz 这 一 一 一 《人 于 tl 2 FF 一世 Ti 一 一 全 过 下 > 人 由 过 mx 


顷 有 3 或 C 的 值 , 实 际 工 作 中 各 采用 下 列 方法 获得 它们 的 粗略 


的 佑 计 值 .〈D 察 往 法 : 知 总 体 过 去 曾 被 调查 过 , 则 采用 过 去 的 S 


或 C 的 估计 值 计 算出 ” 值 .iD 预 查 法 : 先 作 一 个 样本 量 较 少 的 
调查 .以 此 小 额 样本 的 S: 或 C: 的 估计 值 确定 浆 值 ,然后 再 追 吉 


以 此 小 赞 桩 本 的 直下 锅 息 JE HH 


幸 碍 ,使 总 的 样本 量 为 岂 。 
$ 4 本 pps 不 等 概 抽 梓 


在 前 两 节 中 ， 我 们 讨论 的 单纯 随机 抽样 法 对 组 成 总 体 的 各 个 


单元 一 视 同仁 ， 各 单元 有 均等 的 被 抽 中 的 机 会 ,但 实际 生活 中 常 有 
总 体 中 各 单元 不 是 处 于 同等 地 位 的 情况 .例如 , 例 2. 1 中 ,我 们 希 


FF 和 一 


望 调查 该 镇 居民 的 人 均 月 食品 支出 ， 但 调查 以 户 为 抽样 单元 ， 各 户 
的 人 口 数 是 不 同 的 ， 人 口 多 的 户 比 人 口 少 的 户 似乎 应 受到 较 大 的 
重视 .又 如 ,调查 某 地 区 小 麦 产量 ,以 乡 作为 抽样 单元 ,但 各 乡 拥 
有 的 麦 地 面积 是 不 一 样 的 , 这 就 要 求 用 不 等 概 抽 样 , 使 各 单元 被 
抽 中 的 概率 正比 于 所 拥有 的 人 口 数 或 玫 地 面积 应 是 适宜 的 . 这 上 儿 
的 人 口 数 . 麦 地 面积 之 类 的 量 ,我 们 称 为 规模 测度 . 

本 节 介 绍 一 种 最 简单 的 不 等 概 抽样 一 一 有 放 回 pps( 抽 取 概 
率 正 比 于 规模 测度 ?抽样 . 

总 体 %N) 王 tw， uv 的 每 一 个 单元 w 除 对 应 有 指标 量 
Y; 外 ,还 对 应 有 一 规模 测度 X,;( 正 整数 ),z 一 1,…, 和 六 有 放 回 pps 
抽样 的 每 一 次 抽取 ,各 单元 被 抽 中 的 概 认 卫 ;正比 于 X;， 每 一 
次 抽取 后 放 回 被 抽 中 的 单元 ,再 进行 下 一 一 次 抽取 . 具体 的 实现 方 
法 有 : 

(1) 累积 和 法 


令 X- 下 对 {1,2,…,X} 作 有 放 回 简单 随机 抽样 . 设 抽 
中 的 数 为 尺 , 则 当 


YA 革 


1 有 广 】」 sr | < nm Ja ~- 
LI LI 人 个 2 yy，22 八 件 中 


| 1 十 … 十 XN_ 1 十 1),…，X) 时 ,xN 进入 样本 . 
这 一 方法 原理 简单 直接 ,但 当 N 较 大 时 , 求 丸 积 和 X -上 
汪 ALJ Tv /站 天 蕊 1 下 ”四 JR 9 | 一 -人 4 TANRJ 9 JS 1AN7IN < AL93 LAL 1 <AL 3? 
Xi 十 X;， 十 X ,XI 十 … 十 XN_ 1 X 很 且 烦 . 

AN Et JE Ph cv 

《2L) 取 人 岗 候 调皮 全 

令 M=max{f Xi,…，,Xv .每 一 次 抽取 从 1,…,N 中 随机 取 

一 数 a ;再 独立 地 从 1,……,M 中 随机 取 一 数 2. 当 2 委 X,. 时 , 则 v。 

被 才 由 站 人 样本 共 p 允 了 相 次 于 前 元 部 抽 巾 如 几 重 香 了 权 
LU JHI 『 LA AN 个。 TI 2 一 人 ae AUJULLN_ALU -LDLJHU Te AN 有 几 LU 二 LO 了 T 
满 个 样本 单元 为 止 . 这 种 抽取 法 , 易 见 在 一 次 抽取 中 ,各 单元 zx 
3 了  ， ， YE -上 一人- 岂 A 了 II 一 六 个 中 模 济 |[ 谋 所 万 一 六 下 Ye 下 下 As -人 
被 抽 中 进入 样本 的 梳 率 与 其 规模 测 | 2 ] 目 钙 万 信和 六 


了 计算 累积 和 的 麻烦 ,但 取 随 机 数 


人 


的 忆 
例 4.1 一 村 庄 有 8 个 果园 ,分别 有 果树 50,30,25,40,26， 
44,20,35 棵 . 今 以 正比 于 果树 棵 数 的 概率 , 取 3 个 果园 作 样 本 . 


证 cv 届 AR JJ LT 





大 规模 测度 法 取样 M=50. 取得 随机 数 对 (a,p2) 三 

(5,17) ,1 释 c< 和 受 8,1 秋 0 委 50.， 因 17 和 用 26 , 故 第 5 号 果园 进入 样本 ， 
为 第 一 个 样本 单元 ,再 取 第 二 个 随机 数 对 ,得 (a,p) 王 (3,37)， 
1 委 < 委 8,1 秋 6 委 50. 因 37 之 25 ,故此 次 无 单元 进 人 样本 . 再 取 随 
号 


机 数 对 (ay,p) 一 (6,18) ,1 委 a 委 8 1 委 0 委 50. 因 18 科 44, 故 第 6 
遇 山 让 入 样本 沁 利 一 ) 


人 入 ”AAA 一 


汗 
考 
叶 | 

时 
关 


(2,23) ,1 和 < 秋 8,1 和 受 2 委 50. 因 23 和 30, 故 第 2 号 果园 进入 样本 ， 


站 和 铭 一 个 样本 单元 -本 - - 导 Ho y 毕 hkL 上 二 
/ 杂 轴 一 人 件 人 二 /ULU， 作 全 里 上 人 网 ?后 人 作 有 不 ， 


定理 4.1 在 有 放 回 pps 抽样 下 ,在 样 本 记 为 
(yi 9 V2 1 


样本 单元 y 是 总 体 %CN) 的 某 一 单元 ,其 对 应 的 抽取 概率 记 为 


力 ; ,7 一 ] 72。 则 


区 (4.1) 
7 这 ] 也 
是 总 体 总 数 了 = > )Y, 的 无 偏 估计 .其 方差 为 
人 1 1 了， 
VC 二 Pi (站 一 7) (4. 2) 


其 中 尸 , 为 Y， 所 对 应 的 抽取 概率 . 
证 明 : 令 2 一 / 力 ， 1 一 1 7 
则 (〈z: ，…z,) 独 立 同 分 布 
PLZ= 一 YI/P) 一 P， 1 一 1，…,N 





故 
已 ( 立 ) 一 (二 = 一 过 FE(Cz ) 
《和 12 1 二 1 
用 太 
- 工 》(》 王 。P =Y 
1 所/\ -一己 ， ) 
Var(y _) 一 Var( 工 yz = 工 YVarz ) 
PP \ 7 RE 1 122 全 
一 和 P， 证 毕 
72 7 四 \P / 
定理 4.2 在 有 放 回 pps 抽样 下 ,VC(Y。。。) 的 一 个 无 偏 估计 
量 为 
本 1 
oYyow) 一 一 一 一 - 》) 人 《4. 3) 
7\ 1 一 上 /7 二 1] 人 尼 ， / 
证 明 :考虑 zx:，…,z, 是 独立 同 分 布 样本 . 样本 方差 
yi 
3 人 Ye 
是 分 布 


的 方差 
N Y 
忆 ( 志 -JP 

的 无 偏 估计 故 有 本 定理 之 结论 ， 证 毕 ， 


例 4. 2( 例 2. 1 继续 ) 拟 调查 该 镇 居民 人 均 月 食品 支出 , 该 
镇 居民 总 数 为 1 300 人 . 各 户 的 人 数 可 从 户籍 册 获 得 . 以 正比 于 
各 户 人 数 的 抽取 概率 从 345 户 中 作 有 放 回 pps 抽样 ,抽取 20 户 作 
样本 . 得 数据 如 下 : 


样 单 元 号 人 数 ”支出 | 样 单元 号 人 








] 2 142 8 l 
l 人 1063 | 9 4 
3 3 142 ]10 3 
4 2 1695 | 11 9 
9 l 140 12 3 
6 9 178 13 0 
7 4 228 | 14 3 18< | 


抽取 概率 已 , 正比 于 各 户 人 数 , 也 就 是 P,=(〈 该 户 人 数 ) 人 /总 人 
数 ). 故 该 镇 月 食品 支出 总 数 的 估计 值 为 


1 ii 7 











71505.42 





若 总 体 %CN) 的 单元 可 集合 成 若干 互 不 相交 的 子 总 体 , 各 子 
的 单元 的 特性 较为 从 每 一 子 总 体 中 取 一 些 样 单元 组 


AT 呈 Al 


了 二 


中 相近 ， 
总 的 样本 ,这样 的 样本 往往 能 较 好 地 反映 意 体 名 情况 , 比 直 接 
总 体 中 随机 地 抽取 的 样本 更 有 代表 性 . 例如 调查 全 国 成 年 人 的 
身高 ,总 体 是 全 国 的 成 年 人 ， 由 于 我 国 幅员 辽阔 ,各 地 人 的 体 
型 有 一 定 的 差异 ,因而 按 人 类 学 的 特征 ,将 全 国 分 成 西南 .南方 长 


江 流域 .黄河 流域 .北方 等 几 个 子 总 体 . 在 各 个 子 总 体内 较 之 子 总 
体 之 间 人 的 体型 差异 要 小 得 多 . 又 如 调查 民众 对 某 一 问题 的 意 
见 . 将 民众 按 其 职业 分 成 国家 干部 .工人 农民、 家 庭 主妇 等 等 子 
总 体 , 则 子 总 体内 的 意见 也 较为 接近 . 这 样 在 各 子 总 体 中 取 一 样 
本 组 成 总 的 样本 更 能 反映 总 体 的 特性 . 这 种 在 各 子 总 体 中 取 一 样 


ee 9 玫 


本 组 成 总 的 样本 的 方法 称 为 分 层 抽样 , 子 总 体 称 为 层 . 
设 总 体 
MWCN) 一 MWND)U…UqaCND， Ni 十 … 十 Ne 一 N 
第 ; 层 ( 子 总 体 )4KNi) 一 (Ya ya ) 
从 每 一 层 中 抽取 一 样本 
yi yi 1 一 1] ，…, 


& 个 层 的 样本 合 在 一 起 组 成 总 的 样本 . 样本 量 xz 一 六 十 … 十 办 。 记 


网 ， 4 CA 


到 


攻 二 尽 EEK 
性 放 证 汪 
本 
洁 : 
:1 济 
=- 陪 
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77; 


772 








N N 
和 
Ne Ne 
元 = 二 yn 9 (6 一 天 7 
el 
这 册 
二 下 这 


， 大 
六 。 > ,了 了 了 (5， ] ) 
1 一 1 
脸 V 的 于 信任 计 甘 构 六 人 偏 闫 才 
AL HHJA II AL VCv 
上 ] / 六 
V( 了 了) 一 》1W: 一 (1 一 二 15S: (5. 2) 
ee ; 下 ;1/ 


故 立 即 可 得 定理 之 结论 . 
定理 $.2 ” 当 各 层 均 是 单纯 随机 样本 时 ,VY(y*) 的 一 个 无 偶 
佑 计量 为 


[LE (5. 3) 
证 有 骨 ， 


分 搬 抽 样 时 ,样本 量 的 分 配 是 需要 考虑 的 ， 和 


有 量 7 ,如 [ 何 分 配给 各 个 层 ez 己 上 的 耕 本 晕 7 下 面 介 绍 几 种 分 酝 
星 Ab 态 忆 夫人 全 让 HH/ 妆 有 人 件 休 旦 庆 二 村 放 -RUTT 乃 PR 


方法 . 
(1) 等 招 分 配 . 即 每 一 层 取样 本 量 闷 一 z/&、 这 样 分 配 样本 量 


。 42 。 


主要 是 为 了 管理 方便 . 如 每 一 层 由 一 个 调查 员 负 责 . 则 等 额 分 配 


样本 使 各 调查 员 的 工作 量 一 致 
(2) 按 比 例 分 配 . 即 取 


7 
7 一 1 。 和， 1 
这 种 分 配 法 使 各 层 中 的 单元 进入 样本 的 概率 相同 . 此 时 售 计 量 
一 2W 开 袜 S 


z 一 1 /一 1 
-7 


即 > 是 全 部 样本 单元 的 简单 平均 . 这 样 的 样本 在 进行 数据 分 析 
时 党 使 处 理 大 为 简化 . 





(ay 太 吕 有 旦 做 人 兹 上 起 SAY 从 机 | 侍 仁 计 县 败 折 二 公 
\ vv 7 水 到 -HH 人 LU Le -7 7 一 72; 的 AU RU9 LI JE HNNJJ AU 
;一 1 
-人 
二 
上 
0 2 二 7Li VQ3 
VC 一人 (1 二 殉 
达到 最 小 . 用 数学 分 析 中 解 条 件 极 值 的 方法 ,可 求 得 
1Li 一 人 。 ee 9 1 一 1 ，R (5 . 4) 
>，, 风 ,S， 
一 1] 
实际 求 出 必须 知道 $; 间 的 比例 ,一 般 多 采用 察 往 法 或 预 查 法 
获得 $， 间 的 近似 比例 . 

分 层 抽样 的 目的 是 提高 估计 的 精度 和 方便 管理 . 例如 在 全 
国 范围 抽样 时 ,以 每 个 省 为 一 层 . 层 与 行政 区 划一 致 将 极 有 利 
于 调查 的 组 织 管 理工 作 . 为 了 使 估计 有 较 高 的 精度 , 则 应 使 各 
层 内 的 单元 比较 勾 一 . 这 一 点 可 以 从 下 面 的 例 5.1 中 明显 地 看 
出 来 . 


例 S$.1 下 表 是 1984 年 我 国 大 陆 除 西藏 自治 区 外 28 个 省 市 


自治 区 的 工业 产值 ( 亿 元 ): 





1 246. 07 8 104.38 | 15 63.93 22 ”36.54 
2 204. 26 9 “100. 86 16 “63. 10 23 34. 27 
3 ”184. 95 10 ”98. 30 17 ”60.17 24 31.39 
4 25 28.41 





167.43 ] 1 90. 00 18 ”45.62 





假定 从 28 个 省 市 自治 区 中 抽取 12 个 作为 样本 ,来 估计 全 国 





工业 总 产值 . 
(1) 若 直 接 从 28 个 省 市 自治 区 中 用 单纯 随机 抽样 取 12 个 样 
单元 . 则 估计 为 Ysze 一 广 了 . 其 均 方 侦 差 由 2 知 
V(yY JE 人 了 工 [一 于 YG: 
SS 17 人 N 
从 上 表 的 28 个 数据 可 算出 
人 
0 
N 一 下 一 
故 可 得 均 方 伍 差 
VCYse) 一 (28): 训 ( 一 医 )G 721.00) 一 138 917. 33 
(2) 和 耕 将 28 个 省 市 自治 区 分 为 两 层 , 产 值 较 大 的 前 14 个 


为 第 一 层 , 产 值 较 小 的 后 14 个 为 第 二 层 . 按 比例 分 配 样本 量 . 


从 第 一 层 用 单纯 随机 抽样 取 6 个 样 单元 从 第 二 层 用 单纯 随机 
抽样 取 6 个 样 单元 , 则 全 国 工业 总 产值 的 分 层 估 计 的 均 方 偏差 


| ee aa er 本 叶 or 


VCN 了 了 ,)= 六 NmW: 二 六 )S; 


2 一] 


现在 A 一 2,W, 一 区 一 二, 砚 : 一 本 吃 一 司 一 6, 从 前 面 表 中 的 28 个 


数据 可 算出 Si: 三 2 696.72,S; 王 327.61. 故 


4 了 4 
二 


VCN7o) 一 (28): ?| 元， .11 一 站 )(2 696. 72) 
芋 (1 一 吝 )327 6 | 
-56 454. 16 


较 (1) 中 之 值 小 . 
(3) 知 采 用 奈 曼 最 优 分 配 . 在 (2) 中 的 两 个 层 中 作 分 层 抽样 ， 
则 理想 的 样本 量 分 配 为 


(二 1(51.9) 
177;， 一 7 Wo 19 @ \2 / 一 -9 
ee 人 
9 
122 一 7 ha 已 
′ ”了 WS 十 丸 ,S， 
[ - 人 - 局 --TERE  A 己 -L 人 pR 丰 上 昌 十 二 有 上 人 EEI 一 
按 上 述 桩 本 量 在 两 个 层 中 作 单 纯 随 机 抽 和 人 入, 则 全 国 工 业 总 产值 的 
估计 的 均 方 偏差 为 


二 阶 抽样 或 三 阶 、 四 阶 抽 样 在 大 型 的 实际 调查 工作 中 是 常用 
的 方法 . 例如 要 调查 某 省 农户 的 某 些 指标 , 则 各 农户 即 为 最 小 单 


王 人 但 全 知 在 户 洽 有 量 姑 姑 日 入 大 户 的 楼 安 归 所在 乡 针 党 管 ， 天 
AU，。，| 世 王 上 百人 三 刀 蜂 人 入 ”上 唐人 三 有 人 僻 订 力 / 性 之 院 手 上 是 ， 固 | 


而 若 直接 以 农户 为 抽取 单元 无 现成 的 抽样 框 可 以 利用 . 这 时 可 和 采 


记 吕 一 一 IZA、 -直上 沁 十 | 业 OA 一 一 6 的 ACECFL 99 PP 人 一 ~ 上- zz 人 An 山 记 2 大 PT II 《AAA- 


用 二 阶 抽样 . 抽样 分 二 阶段 "进行 . 首 狗 将 全 省 的 乡镇 编导 作为 
第 一 性 抽样 单元 ,在 全 省 中 选 定 若 干 个 乡 作 为 第 一 性 样本 单元 : 


gp “na ” 本 一 证 


然后 再 在 锌 抽 中 的 乡 中 将 农户 编导 作为 第 二 性 抽样 单元 ,选取 乔 


2 


本人 A 


二 农户 为 第 二 性 样本 单元 ,调查 它们 的 数量 指标 . 采用 二 阶 抽样 


>、EEI 一 也 太 /Di 人 上 下 玫 工人 人、 下 AAA 孝 人 FEI 六 广 丰 上 时 直上 -和 


使 锌 调查 的 农户 集中 于 若干 - 卜 乡 ,因而 较 全 省 范围 的 随机 抽 社 ,有 


便于 管理 省力. 省 钱 等 优点 . 但 由 于 被 调查 的 农户 集中 于 若干 个 


乡 中 ,因而 当 同 一 个 乡 内 之 农户 间 的 差异 小 于 乡 之 间 的 差异 时 ,二 
阶 样本 不 如 全 省 范围 的 随机 样本 有 代表 性 . 


二 阶 抽样 问题 的 提 法 如 下 :总 体 
WON) 一 CND)U…UqCND ， Ni 十 … 十 Ne=N 
MKCND) ,一 1,…, 为 第 一 性 抽样 单元 它 有 N, 个 第 二 性 抽样 
单元 
MKCN) 天 (Za ) 1 


调查 的 总 目标 仍 是 总 体 的 总 和 >， 或 总 体 的 平均 值 了 一 


Y/N 等 等 . 它们 是 各 个 第 一 性 抽样 单元 的 目标 量 Y= YY， 的 和 


或 六 的 线性 组 合 . ay 目标 量 记 为 C, 各 第 
一 性 抽样 单元 对 应 的 目标 量 记 为 Ci 一 1,…,&. 不 妨 假定 C= 
Ci 十 … 十 Cx. WE 
中 ,所 以 对 每 个 第 一 性 单元 拟定 一 个 组 内 抽样 计划 ,并 选 定 目标 量 
ci 的 佑 计量 . 给 以 适当 的 记号 列 于 下 表 : 


第 一 性 单元 NT， …， 信和) 
第 一 性 目标 量 Cr Cr 
拟 征 的 种 二 除 笑 方法 1 方法 有 
的 组 内 抽样 法 

一 册 和 人 -二 误 - 本 S 

Lri 日 JD 让 理 上 1 ， 四 人 

g, 的 均 方 修 差 ai ， 站 

隐 ; 的 估计 量 人 2 。…。 ， 亲 2 


Ci MA TI WA 了 LA 


此 外 ,还 需 选 定 第 一 阶段 的 抽样 法 . 常用 的 有 (iD 单纯 随机 抽 梓 ， 
Gi2 有 放 回 pps 抽样 . 对 每 一 个 抽 中 的 第 一 性 单元 , 按 拟定 的 组 内 


.416 。 


抽样 法 抽取 第 二 性 单元 做 调查 ,算出 gs; 以 它们 为 基础 估计 C, 并 


全 岂 包 二 万 一 一 《BT 全 全 


研究 佑 计量 的 均 方 师 坪 ， 


定理 6.1 当 第 一 阶段 采用 单纯 随机 抽样 ,从 天 个 第 一 性 单 


元 中 抽取 上 个 . 抽 中 的 号 码 是 0 ,… ,和 .， 且 拟 定 的 组 内 佑 计量 g， 
满足 :ECg) 王 GE ) 一 oi 9 一 1，…) 民 . 则 


(1) C- 全 2e (6.1) 
是 G 的 无 偶 估 计量. 


(2) G, 的 均 方 偏差 为 


开 2 7 7 了  、 天 . 从 [一 、 
了 





V(G,) 一 全 











上 
十 下 之 /的 (6. 3) 


证 明 : 抽 得 之 组 号 60,，…，,4 是 随机 变量 . 但 对 任何 抽 和 定之 组 
号，8o 和 ,go 是 相互 独立 的 估计 量 . 我 们 用 玖 (tl0) 表 示 在 和，…， 
4 取 定 的 条 件 下 的 数学 期 望 . 有 

忆 (g。 |10) 王 Co ， 
忆 (S83 |10) 生 03 十 C5 ， 1 一 1 
了 (So So 19) 一 Co Ce ， 1 天 J1，71 7 一 1 
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(2) ECC) 一 ELE(C10)] 
-如 ( 估 袜 Ed 0 + 习习 ECeoes [和 

=- 避 [人 ( 估 [dc GE) 十 2 之 GaG。 | 

=() [六 Eeei) 十 袜 ECGi) 


十 2 之 (GaG 
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ECe3 ) 一 ELE(Ce3 10)] 一 E[os 十 GZ 了 


一 元 > 才 十 元 G 


FE(i ) 一 ELE(ai 10)] 一 E(o) 一 上 上 > c 
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人 
K 
SS 
WU 
开 2 K 

-下 /11 1 NG 一 C 二 及 Sa 
有 开 / 六 二 IT 和 天) 下 印 
一 V(C,) 


定理 6.2 当 第 一 阶段 采用 有 放 回 pps 抽样 , 抽 中 的 号 码 为 
由 1 人 估 ,对 应 的 抽取 概率 分 别 为 上 ,上 5 且 拟 阜 的 组 内 估计 
量 卢 ; 满足 :下 (sg;) 一 Gi， 尼 (6 ) 一 ar 1 一 1 ,，…，, 玉 . 则 





~ 4 
(GD Gr = 过 素 (6.4) 
1 一 1 上 0， 
是 CG 的 无 俩 估计 量 . 
(2) Ce。 的 均 方 偏差 为 
机 放 0 (6. 5) 
PPs 民 全 古 民 | EN 1 则 
(3) VCC。) 的 一 个 无 偶 估 计量 为 
上 6GJ-  1L wm (6. 6) 
PP 和 PPs / 
3 HI 人 ， 7 
HL 六 : 闷 Zi 一 8o /Po ， 2 一 二,。 ”9 天 


由 于 抽样 是 有 放 回 PbPs 抽样 , 故 几 人 相互 独立 同 分 布 . 从 而 


Lil 9》” “” )， LA 狼 立 , 且 


FF 一 ( 2 1 一 下 | F(8a | | 一 FT Le 了 
二 人 王 ) 下 | 天 全 | 全 本 志 2 | 











玉 CG -到 
- 交 尼 P 人 8 一 / 全 汪汪 Ps OOSCG 
7 ”7 7 一 1 
We 开 (Z) 一 (EZ) 
二 二 20 区 [了 2 
el 像 ) 由 
-个 ) +eo 二 ee 


SR 
一 2 ( 互 ) 十 GD) 已 一 G 
JE 人 7/ 
SS Ca 
各 忆 名 已 
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WE 
站 |Su 

十 
[MI]> 

dd 
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| 
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于 人 JI 二 | 1 < 1 ge oo 全 
var(Ci) 的 无 博信 计 , 必 二 了 之 人 人 起 一 Co 上 和 定 
1 
2 于 人 \、2 
Var(Z.) 一 >， 抒 Pi( 这 一 G 
ar(Z ) 放 忌 j 
的 无 伍 舍 计 . 从 而 有 和 定理 之 结论 (3) 证 毕 . 
例 6.1 前 面 例 4. 1 中 ,调查 该 村 庄 水 果 总 产量 . 若 采 用 二 阶 
抽样 . 第 一 性 单元 为 果园 . 第 二 性 单元 为 单 棵 果树 ， 第 一 阶段 用 
。 421 。 


正比 于 果园 果树 棵 数 的 概率 作 有 放 回 pps 抽样 , 取 三 个 第 一 性 样 


一 一 TI 3 7 世 有 和 一 人 A、EIL 一 大 一 -下 一 上 着 [一 | 一 天 


单元 , 抽 中 的 号 码 为 (5,6,2). 第 二 阶段 在 每 一 抽 中 的 果园 内 用 
单纯 随机 抽样 取 5 棵 果树 作 第 二 性 样 单 元 , 得 资料 如 下 . 该 村 果 
树 总 棵 数 为 270 棵 . 

二 号 果园 五 号 果园 和 X 号 果园 


拥有 果树 棵 数 44 棵 

638 560 800 

样 本 值 605 610 476 

716 694 613 

535 857 753 

568 515 622 
平均 值 了 612. 4 647. 2 652. 8 
方差 8 4851. 3 18 167.7 16 374. 7 

记 第 ; 号 采 园 为 
CN 一 tr 了 N 


当 第 0 有 果园 被 抽 中 ,从 中 抽出 的 第 二 性 单元 记 为 (ye， ”yy69 710 和 
则 本 例 第 二 阶段 采用 单纯 随机 抽样 , 故 








g; 一 八 y, 王 - 


是 G,= 立 = YYs 的 无 偏 估计 ， 对 应 的 均 方 偏差 的 无 偏 估计 量 
六 一 二 (1 一 本 ]s 


从 而 根据 定理 6. 2, 该 村 水 条 总 产量 Y 三 六 十 … 十 世 . 的 估计 值 为 


< 1 《30)(〈612.4) ， 《26)4047.2) 
Cm 一 定名 | (30/270) 亚 (26/1270) 


(441) (652 8 ) 
(447/270) 


对 应 的 均 方 候 差 的 估计 值 为 


。 422 。 


过 全 116(Kg) 











一 1] 、 

-1 [8 HG 
RCR 一 1)L 和 已/ 

| Eee 全 ) 外 
3 X 忆 30/270 26/270 

(44)(652. 8)， 罗 

二 (人 一 3。 《172 116) | 

一 11641 908 

标准 偏差 的 估计 值 为 


Vu(c) 一 3 412(kg) 
8$7 基于 超 总 体 模 型 的 方法 


前 面 几 节 扼 要 地 介绍 了 传统 的 抽样 调查 的 理论 . 它 是 考虑 固 
定 的 有 限 总 体 ,总 体 的 各 单元 的 指标 量 是 固定 的 ,未知 的 ， 统计 推 
断 的 基础 是 由 总 体 中 按 抽样 设计 抽取 样本 单元 所 形成 的 随机 化 分 
布 . 这 种 方法 也 称 为 基于 设计 的 统计 推断 方法 . 讨论 抽样 调查 理 
论 问 题 的 另 一 种 方法 是 基于 模型 的 方法 . 即 考 虑 现实 的 有 限 总 体 
(Zi YN)} 是 随机 向 量 ( 了 Y ,…,YN) 的 一 个 实现 ,这 个 (了 ，…， 
YN) 叫 做 超 总 体 ,其 分 布 函数 为 F(Czi,…,zw). 由 抽样 设计 抽样 
观测 人 .yy) 作 为 样本 . 利用 此 样本 


之 


对 丈 一 土 SAy 或 Y= SN\Yy 等 作出 预测 ， 分 布 FCz ,xzv) 称 为 
NN 一- 一 人 一/ 可 FFLHdALKAJ。， AH N-L1 9 9 已 NA 

二 刀 上 2 (人 ( 东 /NA - 太 - 

TI 


为 什么 要 引进 超 总 体 分 布 ? 大 致 有 下 列 几 种 解释 . 


一 7 > 【一 一 六 7 1 ki Ap Pr PP | 


(1) 有 限 总 怀 可 作为 一 个 大 的 目 然 总 体 的 一 个 样本 实现 例 
如 ,对 一 片 树 林 调 查 材 积 量 ,每 棵 树 都 可 看 作 是 一 定 自 然 环 境 中 生 


人 


长 的 此 种 树 的 一 个 样本 实现 . 超 总 体 分 布 就 是 这 一 环境 中 生长 的 


ea LO 


CA 


树 的 材积 的 可 能 分 布 . 


7 寺 万 > -AN 一 一 扫 了 一 人 T Le 二 上 He TI 


Yi 人 和 1 十 站 -人 | Inot -上皇 上 一 
(2) 超 总 体 分 布 是 摘 述 现实 世界 的 茶 种 随机 现象 的 模型 ， 如 
经 济 学 .社会 学 中 就 经 常 为 一 些 现象 建立 一 些 研 究 的 模型 . 


人 


(3) 从 贝 叶 斯 统计 的 观点 , 超 总 体 分 布 被 考虑 为 先 验 分 布 . 
4) 超 总 体 模型 是 一 种 数学 工具 ,使 人 们 能 更 透彻 地 了 解 一 


些 理 论 结果 例如 可 研究 在 一 些 确定 的 模型 下 , 某 些 估计 的 最 优 
性 等 问题 

(5) 超 总 体 模型 是 研究 抽样 调查 中 非 抽样 误差 的 _- 个 得 力 
工具 . 

这 里 我 们 只 简略 地 讨论 一 种 很 简单 的 模型 ,通过 它 介 绍 一 些 
有 关 基 于 模型 的 推 其 的 基本 概念 . 

我 们 假 冠 十 二 全 5 二 并 独立 ， 有 相同 的 期 望 4 和 方差 c. J 区 


中 泊 


种 抽样 设计 观测 的 样本 VI 9 9Vr 姨 它 们 中 的 77 个 立 e 由 0 5 
抽样 是 单纯 随机 抽样 ,我们 用 


人 四 
SECyi 0 
;一 1 


来 预测 立 = 乓 (Y, 十 … 十 Yw)， 这 一 预测 满足 ， 
GD) 设计 无 偏 性 ， 即 


_ 太 要 媳 八 
| 
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其 中 已 (。) 表 示 对 设计 形成 的 (9 ,，…,6b,) 随 机 化 分 布 取 期 望 
(2 ) 珊 型 无 俩 性 . 印 
E(y 一 10) 一 0 

甘 中 &( 。) 表 示 对 超 3 上 人 休 4 在 天 ( > 了 攻 衣 页 。|0) 
去 & 三 ON “和 玲 小 上 妥 还 | 条 旋 4 下 必 13? 9? 才 N 7 JJ 鸭 ] 王 。 NU ON\ | V 7/ 
就 是 取 定 6 一 (0 ,0.) 的 条 件 下 ,对 y 一 7 的 分 布 取 期 望 


(3) 模型 设计 无 俩 性 ， 即 


。424 。 


EE(y 一 Y) 一 0 
测 了 ,其 预测 的 误差 以 ， 
人 CE(7 一 了 7) 
来 衡量 ， 它 被 称 之 为 预期 均 方 偏差， 病 期 均 方 偏差 小 的 估计 为 优 ， 
国 五 ( 一 了 7 实际 上 混 有 限 个 非 负 项 的 和 , 故 当 红 ( 了 一 Y)2 | 0 对 


了 


每 个 0 均 存在 时 ， 两 个 期 望 运算 可 交换 次 序 态 外 ， 为 了 记号 的 简 
) 竹 在 前 述 模 型 假定 下 二 YY 下 鳃 信 
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进一步 可 证 明 : 在 上 述 模型 下 ,了 是 了 的 最 小 预期 基 
性 的 模型 无 偏 预测 . 这 是 由 于 对 任意 一 个 线性 预测 
POINT 


下 /1 re 7 


方 伍 差 的 纪 
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EECE 一 了 :一 > (。 和 六 ) 人 > 


而 由 模型 无 储 性 ,有 


zeel0= ia 6 10) 一 


zccjl  、 


玖 (oa.) 必 满足 制约 六 = 1. 易 证 在 此 制约 下 , 当 ai 一 圭 ， 


人 时 (一 方 ) | 到 最 小 什 ， 故 了 是 
购 方 偏 关 的 线性 的 模型 无 信 巴 测 ， 同 时 也 可 证 明了 是 Y 的 最 小 预 
期 均 方 偏差 的 线性 的 设计 无 偏 预测 ,这 是 因为 


卫 p 全 三， CiyVi 一 书 >， QiYoe > ,ai 本 Ye 
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1. 找 一 本 外 语 字 典 . 利用 随机 数 表 , 作 单纯 随机 抽样 ,从 该 字典 中 抽出 
20 页 ,计数 各 页 的 单词 数 , 从 而 对 该 字典 的 单词 总 数 作 出 估计 . 


个 工 让 CT BE 1 Da 一 Do 十 和 由 万 下 FE 3 八 由 放 FT 人 民 7 
CC。 人 JAD 外 的 数据 , 求 宁 典 单 词 总 数 的 置信 和 度 为 0. 90 昌 J 这 [本 DT 入 


各 希望 以 0. 95 的 置信 和 度 保 证 估计 的 相对 精度 卢 =0.:10, 你 认为 需要 抽取 多 


/人 再 作 光 在 本 ? 
少 册 作为 御 本 |! 


3. 成 数 估 计 :在 总 体 %CN) 的 单元 分 为 两 类 . 一 类 拥有 性 质 4A, 必 一 类 
现 要 调查 总 体 中 具有 性 质 4 的 单元 的 成 数 P( 百 分 率 ). 可 令 
-人 单元 ww 具有 性 质 A， 
单元 w 不 具有 性 质 A， 


7 一 一 1 


则 P=7= 入 >)Y， 对 此 种 情形 列 出 单纯 随机 抽样 下 ,的 估计 、 相 


ti 一 1 


阳 
下 
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4.。 从 有 16 238 户 的 一 个 城区 中 ，, 抽 选 300 户 的 一 个 单纯 随机 样本 ,调查 
。 420 。 


该 户 人 均 住 房 面积 是 否 低 于 6 m . 得 到 人 均 住 房 面积 低 于 6m 的 户 数 为 


109 请 估计 这 一 区 中 人 均 住 房 面 积 低 于 6 m: 户 的 百分数 并 给 出 相同 的 标 
409.， 古人 怕人 计 这 入 均 住房 面积 低 万 97/ 


准 偏 差 的 佑 计 . 
5… 调查 某 市 居民 彩色 电视 机 的 普及 率 . 该 市 居民 户 总 数 为 2 703 946 


AI 


户 . 粗 估 普 及 率 为 P,=30%. 若 希望 以 0. 90 的 置信 度 保 证 调查 后 的 普及 率 
的 估计 误差 不 超过 3% , 问 进 行 单纯 随机 抽样 应 取 多 少 户 作 样本 ? 

6. 从 一 个 有 限 总 体 中 抽取 一 个 样本 量 为 mm 的 单纯 随机 样本 ,再 从 这 mm 
个 样 单元 中 抽取 样本 量 为 (<<m) 的 单纯 随机 样本 . 证 明 所 得 的 样本 量 为 > 


的 样本 是 原 有 限 总 体 的 一 个 单纯 随机 帮 本 
人 人 证 水 月 了 陈 闻 有 -和 =- 人 刀 14 件 人 小 ， 


7. 一 乡 调查 在 核 小 党 生 中 途 辍学 的 人 数 ， na 该 乡 


共有 小 学 10 所 ,登记 的 在 校 上 儿童 数列 于 下 表 . 


丰 2 LA 





试用 丸 积 和 法 及 最 大 规模 测 短 法 作 概 率 正 比 于 窒 校 儿童 数 的 有 放 切 pps 抽 
样 . 取样 本 量 ”= 4. 
8. 车 题 7 中 作 有 放 回 pps 抽样 , 抽 中 的 四 个 样 单元 是 1 ,4,7,8 号 .调查 





所 生生 = 


请 利用 上 列 数据 估计 全 乡 小 学 生 辍 学 的 总 人 数 ,并 求 出 相应 的 标 标准 偏差 的 
估计 ， 


9. 证 明 有 放 回 pps 不 等 概 抽样 的 估计 Y,。 的 方差 VY(Y,。) 有 男 一 个 表达 
式 
0 SStpP 了 
人 
10。 证 明 8 5 中 分 层 抽样 样本 量 奈 曼 最 优 分 配 的 结 
I1. 下 面 的 数据 列 出 一 二 以 及 


每 个 层 内 各 农场 播种 水 稻 的 平均 面 称 个 定 作 样 本 量 六 100 的 介 尽 和音 绩 随 


7 JJ Lv JI Lv 号 疙 -< ”PR IAAe 1 AL 人 TEA LA 


机 抽样 . 请 算出 (1) 等 额 分 配 ! (2) 按 比例 分 配 ;(3) 奈 曼 最 优 分 配 时 ,每 层 的 


和 427 生 


人 Ed 本 





二 461 


平均 水 稻 面 积 玉 ,| 5.4 .16.3 34. 5 50.] :63.8 
标准 善 ai 8.3  ，13.3 19. 8 26.0 -35. 2 


. 一 总 体 分 成 两 层 . 克 : 和 和 9$， 的 值 如 下 ， 





本 1 皇 呈 mm ee 


< 
用 ,分 层 抽 样 的 费用 可 可 以 表示 成 下 一 Co 十 5 


| 


6 是 基本 费用 ， G,,， -Ce 分 别 是 各 层 每 调查 一 个 单元 的 费用 . 证 明 在 固定 
费用 下 的 条 件 下 ,使 VCJu ) 达 到 最 小 值 的 样本 量 分 配 有 
1， cc 凡 ;S/VC; 
14、 在 一 个 公司 中 ,高 级 管理 人 员 占 7% ,一 般 男 职 员 占 62%, 一 般 女 职 


员 占 310%4 瑾 调 机 人 八 吉 人 品 人 用 其 种 滑 谢 的 百人 生变 抽 对 上 订 三 尼 作 幸 本 


ve "7 LE LA AL AL JANE 站 AL] 下 拟 对 上 述 三 /全 


量 为 400 的 分 层 单纯 随机 抽样 . 按 粗略 的 猜测 402% 的 一 般 男 职员 ,20 如 的 一 
般 女 职员 ,5%% 的 高 级 管理 人 员 使 用 这 种 设施 ,你 如 何 将 样本 量 . 400 分 配 到 三 
个 层 ? - 

二 在 例 6 1 中 ， 车 第 一 -阶段 采 用 的 是 单纯 随机 抽样 从 8 个 果园 中 取 
了 三 个 样 单元 ， 第 二 阶段 从 被 抽 中 的 果园 作 单纯 随机 抽样 取 5 棵 树 作 第 二 性 
样 单元 . 得 资料 如 例 6. 1 的 表 . 请 计算 该 村 庄 水 果 总 产量 的 估计 值 , 并 给 出 
相 闷 的 标准 术 差 的 估计 . 站 | 


Fe 


13. 如 果 考 虑 调查 


人 《一 有 5 VEA 


16. 一 总 体 有 5 个 第 一 性 单元 . 每 一 第 一 性 单元 包含 200 个 第 二 性 单元 
(人 = 000， Ni =N: =N: 一 N， 一 人 5 一 200). 有 关 指 标 Y 的 数值 如 下 ; 





2 1 10.9 7.8。 13.5 
S? 、 | 1.7. 9.8. 70， .6.5 8.4 
总 平均 一 13. 01， Ca 假定 作 二 阶 抽 样 ， 两 个 阶段 均 用 单纯 随机 抽样 第 一 阶 


段 抽 三 个 第 一 性 单元 ,第 二 阶段 从 每 一 抽 中 的 第 一 性 单元 中 抽取 20 个 第 二 


4 一 人 计 区 古 的 填 丈 rfN 糙 信 部 的 1T non 个 前 寺 古 控 估 前 除 首 姑 随 


TH 直人 加 \i 7 1 工 RU 1 vv LELLJ IT 人 1 一 已 FL 


机 质料 ,样本 量 取 -3 义 2 一 60. 估计 总 秩 的 鸥 值 了 ,比较 (8 和 (b) 两 种 抽样 所 
得 估计 的 均 方 偏差 的 值 . 
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17. 题 16 中 , 蒜 组 内 ;8; 的 值 较 大 .例如 扩大 10 倍 ,S 一 117,S8 一 98， 
S =70,S;=65,S8 二 84. 在 此 情况 下 比较 (a) 和 (b) 两 种 抽样 所 得 估计 的 均 
方 偏差 . 


18. 实际 调查 工作 中 有 一 类 称 为 整 群 抽样 的 技术 , 即 作 二 阶 抽样 时 ,第 
一 阶段 作 某 种 抽样 ,而 第 二 阶段 ,在 被 抽 中 的 第 一 性 单元 内 作 全 面 普 查 ， 试 


了 人 
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就 第 一 阶段 使 用 单纯 随机 抽样 及 有 放 回 pps 抽样 的 情形 ,分 别 导出 整 群 抽 样 
的 估计 总 体 总 数 的 估计 式 ; 以 及 相应 的 均 方 偏差 的 公式 和 均 方 偏差 的 估 


计 式 .， 








, 附 表 1 标准 正 
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态 分 布 数值 表 
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AS 
心 
AL 
AN 
wwAE 
污 
AAA 
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| 






训 六 并 史 (: 
0.00 07506: 1 40 0.919 2 2 30 0.9893 
0.05. 0. 519 9， 1. 42 0..922 2 | 2.33 0. 990 1 
0. 10 0. 539 8 1. 45 0.926 5 2. 35 0. 990 6 
0. 15 0. 559 6 1. 48 0. 930 6 | 2. 38 0.991 3 
0. 20 0. 579 3 1. 50 0. 933 2 2. 40 0. 991 8 
0.25 | 05987 ‖ 155 0.9394 ‖ > 42 | 09922 
0. 30 0. 617 9 1.58 0. 942 9 | 2. 45 0. 992 9 
0. 35 0. 636 8 1. 60 0. 945 2 2. 50 0. 993 8 
0. 40 0.655 4 1. 65 0.9505 2. 55 0. 994 6 
0. 45 0. 673 6 1. 68 0. 953 5 2. 58 0. 995 1 
0. 50 0. 6915 1.70 0. 955 4 2. 60 0. 995 3 
0. 55 0.708 8 1. 75 0. 959 9 | 2. 62 0. 995 6 
0. 60 0.725 7 1.78 0. 962 5 2. 65 0. 996 0 
0. 65 0. 742 2 1. 80 0.964 1 2. 68 0. 996 3 
0. 70 0.758 0 1. 85 0. 967 8 2. 70 0. 996 5 
0. 75 0.773 4 1. 88 0.969 9 2. 72 0. 996 7 
0. 80 0.788 1 | 1. 90 0.971 3 2. 75 0. 9970 
0. 85 0. 802 3 1. 95 0.974 4 2.78 0. 997 3 
0.90 | o0.8159 | 1.96 0.9750 中 2.80 | 0.9974 
0. 95 0. 828 9 2. 00 0.977 2 | 2. 82 0. 997 6 
1. 00 0. 841 3 2. 02 0. 978 3 2. 85 0. 997 8 
1. 05 0.853 1 2. 05 0. 979 8 | 2. 88 0. 9980 
1. 10 0.864 3 2. 08 0.981 2 2. 90 0. 998 1 
1.15 | 0.8749 | 2.10 0.9821 | 2.9%2 | 0.9982 
1. 20 0. 8849 | 2. 12 0. 983 0 2. 95 0. 998 4 
1. 25 0. 8944 2. 15 0.984 2 2. 98 0. 998 6 
1. 28 0. 899 7 2. 0.985 4 3. 00 0. 998 7 
1. 30 0. 903 2 2. 0.986 1 3. 50 0. 999 8 
1. 32 0. 906 6 2. 0.986 8 4. 00 0. 999 97 
1. 35 0.9115 2. 0. 987 8 | 5. 00 0. 999 999 7 
We 





1. 38 0. 2 ， 0 7 6. 00 
9 个 9 


*。 430 。 


` 附 表 .2 tt 分 布 临 界 俱 表 ， 









AN 0. 20 . 0. 10 0. 05 0.01 0. 001 
] 3. 078 6. 314 12. 706 63. 657 “| 636. 619 
2 1. 886 2. 920 4. 303 9. 925 31. 598 
3 1. 638 2. 353 3. 182 5. 841 12. 924 
4 1. 533 2. 132 2. 776 4. 604 8. 610 
5 1. 476 | 2. 015 2. 571 4. 032 6. 859 
6 1. 440 1. 943 2. 447 3. 707 5. 959 
7 | 145 ， | 18%5 | 2.365 | 3.499 | 5.405 
8 1. 397 1. 860 2. 306 3. 355 5. 041 
9 1. 383 1. 833 2. 262 3. 250 5. 781 
10 1. 372 1. 812 2. 228 3. 169 4. 587 
11 1. 363 1. 796 2. 201 3. 106 4. 437 
l12? | 1356 | 1782 | ?179 | 3.055 | 4318 
13 1. 350 1. 771 2. 160 3. 012 4. 221 
14 1. 345 1. 761 2. 145 2. 977 4. 140 
15 1. 341 1.753 2. 131 2. 947 4. 073 
16 1. 337 1. 746 2. 120 2. 921 4. 015 
下 1. 333 1. 740 2. 110 2. 898 3. 965 
18 1. 330 1. 734 2. 101 2. 878 3. 922 
19 1. 328 1. 729 2. 093 2. 861 3. 883 
20 1.325 1. 725 2. 086 2. 845 3. 850 
21 1. 323 1. 721 2. 080 2. 831 3. 819 
22 1. 321 下 2. 074 2. 819 3. 792 
23 1. 319 1.714 : 2. 069 2. 807 3.767 
24 | 138 | 1711 | 2.064 .| 2.797 | 3.745 
25 1. 316 1. 708 2.060 | 2.787 3. 725 
26 1. 315 1. 706 2. 056 2.779 3. 707 
27 1. 314 1. 703 ] 2. 052 2.771 3. 690 
28 1. 313 1. 701 2. 048 2. 763 3. 674 
29 | 1.3I1 | 169%9 | 2.045 | 2.756 | 3.659 
30 1. 310 1. 697 2. 042 2. 750 3. 646 
40 1. 303 1. 684 2.021 |.， 2.704 3. 551 
60 1. 296 1. 671 2. 000 2. 660 3. 460 
120 1. 289 1. 658 1. 980 2. 617 3. 373 
co 1. 282 1. 645 1. 960 2. 576 3. 291 


[ 注 ] m: 自 由 度 ,: 临 界 值 ,P{1il>A} 一 ao， 。 


阶 表 3f :X 分 布 临界 值 表 








5 … 0.000 3 5. 
2 0. 050 6 5. 99 7. 38. 9. 21 
人 0.216 | 7.81 9. 35 11.3 
4 0.484 |. 9. 49 11.1 13. 3 
5 | 0.831 | 11.07 ， 12.8 15.1 ， 
6 1.24 | 12.6 | 144 .| 16.8 
7 | 1. 69 14.1 16.0 18.5 
8 2.18 15.5- 17.5 20. 1 
9 2.70 16. 9 19.0 | 21. 7 
10 3.25 | 18.3 | 205 | 六 
11 3.82 19. 7 21. 9 24. 7 
12 4.40 ，. 21. 0 23. 3 26. 2 
13 5.01 .， 22. 4 24. 7 27. 7 
14 5. 63 23. 7 26.1 29..1 
15 6. 26 25. 0 27. 5 30. 6 
16 6. 91 ， 26. 3 28.8 32.0 
17 7. 56 27. 6 30. 2 33. 4 
18 8. 23 28. 9 31.5 34. 8 
19 8. 91 30.1 32. 9 36. 2 
20 9. 59 31.4 34. 2 37. 6 
21 | 10.3 32.7 | 35.5 | 38.9 
22 11.0 33.9 36.8 40..3 
23 11. 7 35. 2 38. 1 41. 6 
12. 4 36. 4 39.4 43. 0 
25 | 13:1 37.7， | 40.6 | 44.3 
26 13. 8 38. 9 41.9 ， ，45. 6 
27 14. 6 40. 1 43. 2 47. 0 
28 15. 3 41. 3 44.5  . 48. 3 
29 16. 0 42. 6 45.7 49. 6 
30 16. 8 43. 8 47.0 50. 9 
[ 注 ] 2: 自由 度 , :临界 值 ,P{X > 人 } 一“ 
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